このリポジトリは、リクルートワークス研究所 機関誌『Works』のバックナンバーを題材に構築する個人向けナレッジベース。スキーマ思想は ../BookSummary/CLAUDE.md を踏襲し、雑誌(号単位)向けに適応している。
目的: 過去号コンテンツ間を関連づけて理解し、今後の連載テーマの候補を考える。横断テーマ抽出と未来の企画アイデアを主成果物とする。
ソースは backnumber/ にある PDF 50号(w_146.pdf 〜 w_195.pdf, 2018-02〜2026-04, 8年余り)。LLM はこの schema を読み、号単位で構造化された wiki を増分的に構築・維持する。
このプロジェクトでは仮想環境 C:\Users\lmnag\python-venv\QSF を使用する。
C:\Users\lmnag\python-venv\QSF\Scripts\python.exeC:\Users\lmnag\python-venv\QSF\Scripts\pip.exeRecruitWorks/
├── CLAUDE.md # このファイル: schema
├── backnumber/ # 原典 PDF (不変)
│ └── w_NNN.pdf
├── raw/ # 抽出済み生テキスト (不変)
│ └── w_NNN.txt
├── tools/
│ └── tategaki_to_yoko.py # 縦書き→横書き後処理 (BookSummaryから複製)
└── wiki/
├── index.md # 全ページのカタログ
├── log.md # 時系列の活動ログ
├── issues/ # 号カード層 (各号1ファイル、~500-1500字)
│ └── w_NNN.md
├── summaries/ # 号の構造要約層 (各号1ファイル、~3000-8000字)
│ └── w_NNN.md
├── themes/ # 【全号ingest後】複数号を横断するテーマ
│ └── <ThemeID>.md
├── entities/ # 【将来】頻出論者・組織ページ
└── ideas/
└── future-themes.md # ★成果物: 今後の連載テーマ候補(根拠付き)
w_NNN(Works誌号数、3桁ゼロ埋めなし — 146〜195、計50号)w_NNN.pdf と一致させるissues/w_NNN.md)号の「名刺」。特集テーマ・主要記事・ポジションを素早く思い出せる粒度。目安 500-1500字。
必須要素 (frontmatter):
---
issue: NNN
title: <特集タイトル>
subtitle: <副題があれば>
date: <発行年月 YYYY-MM>
pages: <総頁数>
source: raw/w_NNN.txt
tags: [主題タグ, ...]
type: issue_card
---
本文構成 (柔軟):
summaries/w_NNN.md)号の論点マップ。記事別の主張・根拠・具体例を箇条書き中心で。目安 3,000-8,000字。
frontmatter:
---
issue: NNN
title: <特集タイトル>(構造要約)
date: <YYYY-MM>
source: raw/w_NNN.txt
card: ../issues/w_NNN.md
type: issue_summary
---
本文構成:
> で残す## <記事タイトル>(著者名) の形式書かないこと:
themes/) — 全号ingest後に作成複数号を横断する主題を抽出し、雑誌の編集的関心の変遷を可視化する。
導入条件:
本文構成:
ideas/future-themes.mdこのプロジェクトの最終成果物。テーマページ群から導かれる、今後取り上げるべき連載テーマの候補リスト。
書式:
## 候補N: <テーマ名>
**動機**: なぜ今これを取り上げるべきか(過去号の空白、時事的必然、読者関心の動向)
**拠点となる過去号**: w_XXX (YYYY-MM), w_YYY (...)
**未扱いの切り口**: 既存号がカバーしていない論点
**想定される主要論者/組織**:
**連載構成案**(任意): 3-5回の回割り
entities/) — 将来backnumber/w_NNN.pdf から raw/w_NNN.txt へ
- PyMuPDF で抽出 → tools/tategaki_to_yoko.py で後処理
- Works誌は横書き・2段組が多いが、カラム順序の乱れ対策として後処理スクリプトを通すwiki/issues/w_NNN.mdwiki/summaries/w_NNN.md## [YYYY-MM-DD] ingest | w_NNN <特集名>import fitz
doc = fitz.open('backnumber/w_NNN.pdf')
out = []
for i, page in enumerate(doc):
out.append(f'\n\n===== PAGE {i+1} =====\n\n')
out.append(page.get_text())
with open('_tmp_raw.txt', 'w', encoding='utf-8') as f:
f.write(''.join(out))
続けて後処理:
python tools/tategaki_to_yoko.py _tmp_raw.txt raw/w_NNN.txt
===== PAGE N ===== マーカーは grep ナビゲーションに使うので必須。
themes/<ThemeID>.md を作成ideas/future-themes.md へ蓄積wiki/index.md を読むraw/w_NNN.txt で grep して原文裏取り[w_195](../issues/w_195.html) の形式w_NNN (YYYY-MM) で統一全50号(w_146〜w_195, 2018-02〜2026-04, 8年余り)ingest完了。詳細は wiki/index.md と wiki/log.md を参照。
成果物:
- raw/w_NNN.txt × 50(PyMuPDF抽出済み)
- wiki/issues/w_NNN.md × 50(号カード)
- wiki/summaries/w_NNN.md × 50(構造要約)
- wiki/themes/*.md × 10(横断テーマ)
- wiki/ideas/future-themes.md(連載候補22本、最優先A候補6本)
- wiki_html/ — HTML版全118ページ(tools/build_wiki_html.py で生成)
編集長4代の変遷: - (w_146-w_147, 2018-02〜04) 編集長不明、石原は当時"人事研究センター長" - 石原直子 w_148(2018-06)〜w_159(2020-04)、12号 — 原則づくり・先駆性 - 佐藤邦彦 w_160(2020-06)〜w_174(2022-10)、15号 — 体系化・大規模調査 - 浜田敬子 w_175(2022-12)〜w_192(2025-10)、18号 — 社会運動・提言 - 佐々木貴子 w_193(2025-12)〜、3号 — 経営人事・統合
Works誌の5-8年テーマサイクル: 石原期の特集は5-8年後に浜田/佐々木期の大特集として回帰(10パターン確認、詳細は themes/EditorEraAnalysis.md)。
この schema 自体は運用段階にあり、継続的に修正してよい。ルール変更は log.md に記録する。