變更紀錄

本資料集所有資料校正、研究結果與方法學變動的完整歷史。每筆對應 git commit, 完整版見 CHANGELOG.md

a980a13

Primary-source 擴充 + 女校欄位誤植修正

新增 Added

  • data/junior-high-rankings-official.json 擴充至 15 筆已驗證的國中官網直接公告
  • 新北市 11 筆 114 實錄:林口、南山、裕德、竹林、格致、金陵女中、辭修、中山(科學班)、福和(科學班)、江翠(科學班)
  • 新北市 1 筆 114 達標:新莊國中;基隆市 1 筆 114 混合:武崙國中
  • 原始 PDF 存檔至 sources-archive/cross-references/primary-junior-high/

驗證 Verified

  • 6 筆官方資料與雪莉部落格 114 完全吻合:林口 5/5/10、南山 28/21/20、裕德 14/2/7、竹林 6/0/4、格致 1/3/3、辭修 3/0/1
  • 結論:雪莉資料品質得到反向驗證,對於有公告的學校數字可信

修正 Fixed

  • 金陵女中國中部 114:ckhs: 8, tfg: 0, hs: 2ckhs: 0, tfg: 8, hs: 2
  • 衛理女中國中部 114:ckhs: 6, tfg: 0, hs: 1ckhs: 0, tfg: 6, hs: 1
  • 根因:雪莉表格中女校的建中欄位為空白(而非 0),初版 WebFetch 轉錄時未察覺空欄,將北一值錯置到建中
  • 校正來源:金陵女中官網明列具名錄取(8 人北一女、2 人師大附中、0 人建中)

揭露 Disclosed

  • 林口國中 URL 錯誤:第 1 個 agent 聲稱 /p/407-1000-80-1.php 有 5/5/10 資料。親自 WebFetch 驗證為空頁面。第 2 個 agent 找到正確 URL /p/406-1000-10110,r58.php,PDF 下載確認為真
  • 木柵國中假資料:第 1 個 agent 聲稱木柵榮譽榜有具名 5/1/2 資料。用 Playwright 實地渲染驗證,木柵官網首頁與榮譽榜均無此資料。判定為 Google 快取把雪莉同校數字誤認為學校本站
  • 教訓:即使 agent 標示信心「HIGH」,仍須親自 fetch 驗證每一個 URL

研究 Research

  • 臺北市 30 所:1 所(大安國中)有具名實錄;25 所 2019 後已無公開資料
  • 新北市 28 所:7 所完整實錄、3 所僅科學班、1 所達標、17 所無
  • 基隆市 3 所:1 所混合(武崙);其他 2 所無
  • 臺北市私立 5 所:全部只發大學榜單,無國中部公開
  • 結論:無法從國中官網替代雪莉部落格,但能為新北市 7 所做 primary-source 交叉驗證
1d91327

建立 /rankings-official 頁 + schema 擴充

新增 Added

  • data/junior-high-rankings-official.json 初版 3 筆
  • /rankings-official 獨立頁面,與社群整理頁區分
  • Zod schema 新增 OfficialRankingSchema,含必填 methodology enum: 實際錄取 / 達標 / 預估 / 混合
  • 每筆記錄強制保留 quotedText(逐字引用),避免方法學誤讀

修改 Changed

  • 明確分離兩張表,避免兩種測量方式被誤認為可互換:junior-high-rankings.json(雪莉,全部實錄)vs junior-high-rankings-official.json(各國中官網,方法學混雜)
42331c2

整合交叉驗證來源 + 陷阱揭露

新增 Added

  • PTT SENIORHIGH 112 學年度情報文(vbn22):獨立方法學,強調「實際上榜 ≠ 達標」
  • PTT SENIORHIGH 113 學年度錄取分數
  • ETtoday 2023-04-06 報導:臺北市教育局副局長陳素慧正式否認曾公布類似排名
  • 中平國中 114 會考成績:典型「達標」陷阱範例,非實錄
  • ArchivedSourceSchema 新增選填欄位 methodology

修改 Changed

  • 新增「最重要的陷阱:達標 vs 實際錄取」專節
  • 新增「為什麼沒有官方資料?」段落,含教育局副局長否認引文
  • 來源清單依可信度分組重排
  • 「已知限制」新增說明為何找不到獨立的第二個民間 compiler

研究 Research

  • 台灣只有 1 個真正的 primary collector:雪莉部落格
  • 爸媽不要慌、PTT、裕德國中官網等看似多來源,實際全部 repost 雪莉資料
  • 爸媽不要慌自述:「資料取之於網路(雪莉的數位生活),無任何修正或調整」
  • PTT vbn22 為少數方法學獨立來源,但資料不完整

揭露 Disclosed

  • 中平國中 114 公告:「達建中預估分數男生共 13 人」—— 是達到門檻不是實際錄取
  • 雪莉同校 13/14/14:達標 13 = 實錄 13(建中符合);達標 12 ≠ 實錄 14(北一差 2 人)
  • PTT vbn22 警告:「越來越多學校、家長會用達標而非實際上榜來混淆視聽」
baa63ce

Rankings 資料結構大改版

修改 Changed

  • 舊:約 40 筆,只有建中 { targetSchool: "ckhs", admittedCount: 67 }
  • 新:約 150 筆,3 校完整 + 畢業人數 + 錄取率 { admissions: {ckhs, tfg, hs}, subtotal, totalGraduates, admissionRate }

新增 Added

  • /rankings 頁新增「3 校總合錄取率」主表(依錄取率排序)
  • 每年度另列建中、北一、附中各自 top 15 子表
  • /year/[year] 改顯示「3 校總合前 20 名」取代「建中 top 15」

修正 Fixed

  • 先前只有建中頁有排行資料的 bug:北一女、師大附中頁現在各自顯示資料
8cbba54

Phase 1 MVP 初版

新增 Added

  • 5 份 JSON 資料集:quotas、aggregate-stats、cutoffs、junior-high-rankings、sources
  • 6 份原始 PDF/HTML 存檔到 sources-archive/(避免連結失效)
  • Astro 6 + TypeScript 靜態網站,10 頁面
  • Zod schema 於 astro build 時強制驗證
  • DataSourceBadge(官方/半官方/民間三色)+ CitationFooter + DisclaimerBox 元件
  • GitHub Pages 自動部署 workflow
  • 授權:程式碼 MIT + 資料集 CC BY 4.0

研究 Research

  • 官方只公布年度招生名額整體錄取統計
  • 各校最低錄取積分官方不公布,需從新聞/國中/補習班交叉比對
  • 國中錄取排行官方完全沒有,只有雪莉部落格一個收集者
  • 無任何官方 CSV/JSON/API,全是 PDF/HTML
  • 個資法 2019 年後趨嚴,多數國中已不公開具名榜單

資料可信度分級

級別徽章來源範例
官方 官方 基北區免試入學委員會簡章、教育局新聞稿
半官方 半官方 國中自製 PDF、補習班整理、主流媒體報導
民間統計 民間統計 個人部落格手動彙整、PTT、家長社團

方法學分類(國中官網公告用)

方法學意義
實際錄取免試分發後確實進入該校就讀
達標會考積分達門檻,未必錄取或就讀
預估分發前的估算
混合同一來源含多種測量,難以區分