Codebook

📊 HKSPD Codebook 資料架構與詳解

1. 變量編碼表 (Variable Codebook)

Variable Name Description Model Answer
caseID 該自殺個案的 唯一個案編號 2026011401
newsDate 該新聞報道建立的 日期 2026-01-14
newsTime 該新聞報道建立的 時間 13:46
newsHelp 該新聞報道有否提供 求助熱線或網站 有
newsURL 該新聞報道的 網址 https://siuyeo.ng/hkspd202601140942
caseDate 該自殺個案發現的 日期 2026-01-14
caseTime 該自殺個案發現的 時間 09:42
Area 該自殺個案發現地點的 區域 新界
District 該自殺個案發現地點的 地區 大埔區
subDistrict 該自殺個案發現地點的 分區 大埔
Unit 該自殺個案發現地點的 街道 / 屋邨 / 建築 廣福邨
subUnit 該自殺個案發現地點的 門牌 / 樓宇 / 地點 廣祐樓
Latitude 該自殺個案發現地點的 緯度 22.4479738612337
Longitude 該自殺個案發現地點的 經度 114.1747174766170
House 該自殺個案發現地點的 房屋類型 公共屋邨
firstName 綜合媒體提及 事主的 姓氏 胡
Gender 綜合媒體提及 事主的 性別 女
Age 綜合媒體提及 事主的 年齡 74
Hospitalized 綜合媒體提及 事主有否 送院救治 沒有
State 綜合媒體提及 事主的 綜合狀態 身亡
suicideNote 綜合媒體提及 警方有否 檢獲遺書 沒有
mental_illness 綜合媒體提及 事主有否 精神病患記錄 沒有
emotional_illness 綜合媒體提及 事主有否 情緒病患記錄 有
missingRecord 綜合媒體提及 事主有否 失蹤記錄 沒有
reason1 綜合媒體提及 事主自殺的 懷疑原因 1 健康
reason2 綜合媒體提及 事主自殺的 懷疑原因 2 (同上 沒有的話會漏空)
reason3 綜合媒體提及 事主自殺的 懷疑原因 3 (同上 沒有的話會漏空)
type1 綜合媒體提及 事主自殺的 個案類別 1 自縊
type2 綜合媒體提及 事主自殺的 個案類別 2 (同上 沒有的話會漏空)
type3 綜合媒體提及 事主自殺的 個案類別 3 (同上 沒有的話會漏空)

2. 數據架構與欄位詳解

HKSPD 的數據結構設計極為詳盡,涵蓋了事件的多個維度,為研究者提供了豐富的變量以進行多層次分析。根據提供的文件,資料庫的核心欄位可分為四大類別。

2.1 報道基本資料 (Report Metadata)

這部份記錄了數據的來源屬性與時間標記。

  • caseID:個案的唯一識別編號,是用戶進行數據檢索與引用的主鍵。
  • newsDate / newsTime:新聞報道的建立日期與時間。這反映了信息傳播的時間點。
  • caseDate / caseTime:個案被發現的日期與時間。這與新聞發佈時間可能存在差異(例如深夜發生的案件可能在次日早晨報道)。
  • newsURL:新聞報道的來源,確保數據的可查證性。
  • newsHelp:一個重要的倫理指標,記錄該篇新聞報道是否在文末或顯眼處提供了求助熱線資訊。這可用於評估媒體的報道倫理水平。

2.2 地理資訊 (Geographical Information)

地理欄位是 HKSPD 進行空間分析的基礎,其精細度達到了街道/建築級別。

  • Area:大區分類(香港島、九龍、新界)。
  • District:全港 18 區行政分區(如觀塘區、沙田區)。
  • subDistrict:更細緻的社區劃分。
  • Unit / subUnit:具體的街道名稱、屋苑或建築名稱。
  • Latitude / Longitude:精確的經緯度座標。這是生成「自殺地圖」與進行熱點分析 (Hotspot Analysis) 的關鍵數據。
  • House:房屋類型分類。這是一個極具社會學意義的變量,通常分為「私人屋苑」、「公共屋邨」(公屋)、「居者有其屋」(居屋)、「非住宅」(如商場、酒店、橋樑)等。透過分析房屋類型,研究者可以探討社會經濟地位 (SES) 與自殺風險之間的潛在關聯。

2.3 個人資料 (Demographics)

為了保護隱私,個人資料經過了去識別化 (De-identification) 處理,僅保留統計學特徵。

  • firstName:姓氏或稱謂(如「陳先生」、「一名女子」)。
  • Gender:性別(男/女)。
  • Age:年齡。
  • Hospitalized:是否送院治理。
  • State:個案的最終狀態(如「身亡」、「清醒」、「昏迷」)。這區分了自殺死亡 (Suicide Death) 與企圖自殺 (Attempted Suicide)。

2.4 背景與成因 (Context & Causality)

這部份數據試圖捕捉事件背後的社會心理因素,但受限於媒體報道的深度,通常僅供參考。

  • suicideNote:是否有檢獲遺書。
  • mental_illness:是否有提及精神病患記錄。
  • emotional_illness:是否有提及情緒病患記錄。
  • missingRecord:死者生前是否被列為失蹤人士。
  • reason1 / 2 / 3:懷疑自殺原因(如「因病厭世」、「金錢問題」、「感情困擾」)。需注意,這些原因通常源自警方初步調查或家屬透露,並非臨床心理剖析的結果。
  • type1 / 2 / 3:自殺方式類別(如「跳落」、「燒炭」)。這一數據對於監測特定自殺方式的流行趨勢至關重要。