資料方法論
本資料集遵循「Verifiable over Complete」原則:寧可資料較少,也要每一筆都可追溯、可驗證。
資料來源分級
每筆資料均依來源可信度分為三級,網站上以不同顏色徽章標示:
| 級別 | 徽章 | 說明 |
|---|---|---|
| 官方 | 官方 | 由教育部、教育局或基北區免試入學委員會等官方單位公告之資料。如簡章 PDF、分發結果新聞稿 |
| 半官方 | 半官方 | 未由官方直接發布,但由學校、補習班、主流媒體彙整之資料。可靠性中等,不同來源間數字可能略有差異 |
| 民間統計 | 民間統計 | 由個人部落格、網友自行蒐集之資料。通常為手動爬取各校榮譽榜,資料完整度低,僅供參考 |
⚠ 最重要的陷阱:「達標」 vs 「實際錄取」
為什麼沒有官方資料?
針對「哪所國中錄取建中/北一女/附中幾人」這類統計,至 2026-04 為止仍然:
- 教育部統計處 depart.moe.edu.tw/ED4500 — 僅有 HS 畢業去向,沒有 國中 → 高中的 pipeline
- data.gov.tw — 搜尋「免試入學」0 筆
- data.taipei — 搜尋「免試入學」0 筆
- 臺北市教育局 — 明確否認曾公布此類資料
2023 年 ETtoday 報導 (原文) 引述副局長陳素慧:「教育局內部從來沒有公布類似資料,不清楚該份排名的來源與真實性」。 教育局的立場明確:不鼓勵此類排名文化,呼籲家長重視「就近入學」與「適性學習」。
本資料集在尊重此立場的前提下,仍以開放方式整理民間流傳的資料,並強制呈現免責說明與方法學限制, 讓使用者在理解資料性質的情況下自行判讀。
資料收集流程
- 來源確認:每筆資料必須有可點擊的 URL,優先採用官方單位(教育部、教育局、委員會)之公告。
- 存檔備份:將原始 PDF/HTML 存檔至 repo 的
sources-archive/<學年度>/,避免連結失效。 - 手動轉錄:為降低自動 parse 錯誤,初期採人工轉錄為 JSON,每筆均交叉比對原始文件。
- Schema 驗證:使用 Zod 於網站建置時 (
astro build) 驗證所有 JSON,缺漏或格式錯誤會直接 fail build。 - 多來源並存:半官方資料(如最低錄取積分)若不同來源數字不同,全部保留、並呈現差異,不隱藏。
- 方法學標註:若來源測的是「達標」而非「實際錄取」,於
sources.json的methodology欄位明確區分,不併入主資料。
完整來源清單
官方 官方
教育部 114 年 1 月 13 日臺教授國字第 1130156217 號函核定。包含全基北區高中職招生名額、比序規則。
半官方 半官方
福安國中自行彙整之公立高中各校名額(含回流名額)與 112、113 年最低錄取分數。福安自述「各最低錄取分數僅供參考!!!」
114 會考成績 — 中平國中公告(達標人數非實際錄取) 達標 (threshold, not actual)
⚠ 此為陷阱資料(trap reference)。中平國中自行公告「達建中預估分數(34.8分)男生共13人、達北一預估分數(33.8分)女生共12人…預估建北第一志願共27人」。此為**達標人數**(達到錄取門檻)而非**實際錄取人數**。雪莉部落格的同校 114 資料為 13/14/14=41(含附中),顯示達標與實際錄取雖接近但不相等。本筆存於資料集僅為說明「達標 vs 實際」陷阱,不併入 junior-high-rankings 數據。
民間統計 民間統計
個人部落格彙整各國中榮譽榜。作者自述:「目前公布的資料很少…將會比對資料與持續更新中」
[情報] 112學年度 基北區國中 建北錄取率 實際錄取 (non-達標)
PTT 匿名網友整理 112 學年度基北區各國中建中+北一女實際錄取率。方法學明確:「錄取率 = [(該校實際錄取建中 + 北一女人數) / 該校畢業總人數] × 100%」;作者強調「本表為實際上榜,與一般所稱達標不同」,是與雪莉獨立的交叉驗證來源。頂部排名(中正、龍門、敦化)與雪莉一致。
PTT 網友整理 113 學年度各校錄取分數,可與福安國中 PDF 交叉比對。
新聞 / 免責聲明 官方
基北區國中排名瘋傳被酸「黑名單」 北市教育局:未公布資料來源不明
極重要的免責來源。報導 111 學年度類似排名瘋傳後,臺北市教育局副局長陳素慧正式澄清:「教育局內部從來沒有公布類似資料,不清楚該份排名的來源與真實性」。本資料集在 /methodology 與 /rankings 頁明確引用此免責,避免讀者誤認我們的資料為官方來源。
資料集下載
資料集以 JSON 格式釋出,授權 CC BY 4.0。直接從 GitHub 取得:
quotas.json— 年度招生名額aggregate-stats.json— 整體錄取統計cutoffs.json— 各校最低錄取積分junior-high-rankings.json— 國中錄取排行(民間統計)sources.json— 所有來源清單 + 學校 metadata
引用方式
若您在研究、報導或其他場合使用本資料集,請依以下方式引用:
基北區國中升學資料集 (n.d.). 建中、北一女、師大附中歷年錄取資料. GitHub. https://github.com/bobo52310/junior-high-school
重要:本資料集僅為二次整理,原始資料之權利歸原發布者所有。引用時請同時註明原始來源。
已知限制
- 科別範圍:目前僅收錄「普通科」免試入學資料。科學班、人文社會資優班、特色招生、直升入學等其他管道 不在本資料集範圍內。
- 最低錄取積分:基北區免試入學委員會不公布此資料,需仰賴國中、媒體、補習班的彙整。
- 國中錄取排行:目前 99% 的資料來自雪莉部落格單一來源。本專案研究過其他替代方案(PTT、家長網站、國中官網、補習班整理),結論為:
- 所有主要民間彙整(爸媽不要慌、PTT、裕德國中官網)都直接 repost 雪莉資料,非獨立來源
- 各國中官網自行公布者多為「達標」而非「實際錄取」,語意不同無法直接替代
- 2019 年後臺北市教育局不鼓勵排名文化,多數國中已不公布此類統計
- 個資法考量:2018 年後部分學校因個資法不再公布具名榜單,本資料集亦不收錄學生姓名。
貢獻資料
歡迎提供更多年度、更多來源,協助資料集完整化。請至 GitHub Issues 回報,或直接提交 Pull Request。 新增資料時,必須:
- 提供可驗證的 URL(官方或 reputable 媒體)
- 遵守 Zod schema(見
site/src/lib/schemas.ts) - 將來源 PDF/HTML 存檔至
sources-archive/ - 若為「達標」資料,請標註
methodology: "達標",不得併入實際錄取資料列 - 在
sources.json的archivedSources加入一筆對應記錄