公開日: 2016.11.11 / 最終更新日: 2023.03.03
デジタル版『渋沢栄一伝記資料』凡例
1. 公開の趣旨
2. 公開基準
3. テキスト化基準
1. 公開の趣旨
2. 公開基準
- 前提となる冊子版・デジタル版の構造
- 冊子版『渋沢栄一伝記資料』本編(1~57巻)は、以下により構成される。
(1) 「目次」事業別/年代順に並べた出来事=見出し、および、見出しを年月日で細分化した詳細目次
(2) 「綱文」目次にあげる出来事についての要約文・解説文
(3) 「引用資料」綱文の典拠となった一つ或いは複数の資料
(引用資料名・著作者名・冊子版編纂時の原本所蔵者名を併記)
- デジタル版では、冊子版構成要素の各々に固有のID(No.)を付与し、リスト化および再構造化を行った。
- 冊子版 本編(1~57巻)の構造による公開基準 (○:公開/×:未公開)
冊子版 本編(1~57巻)
| | デジタル版 |
テキスト | ページ画像 |
- | 表紙・裏表紙 | | × | × |
扉(標題紙) | × | ○ |
凡例 (1巻・30巻)
| ○ (公開実験版のみ)
| ○ |
目次【綱文】A | × | ○ |
本文 | 目次【綱文】B | ○ | ○ |
引用資料名 著作者名・所蔵者名
| ○ | ○ |
引用資料テキスト
| ○ | ○ |
- | 後記・刊行事歴 (57巻)
| × | × |
奥付 | × | ○ |
- 目次【綱文】:詳細目次と綱文はセットで掲載されるため「目次【綱文】」として扱う。冊子版では、A.各冊冒頭 および B.各冊本文中 の2箇所に掲載され、両者は文言の使用に若干の差異がある。デジタル版では本文中に使用される「目次【綱文】B」を基準として採用する。
- 引用資料名:基本的に冊子版記載通りとしたが、以下の場合は補記を行った。
(1) 典拠となった資料原本により、明らかに冊子版の記載に誤記を確認したもの →[ ]で補記
(2) 同一の引用資料名が続く場合 →本文テキスト冒頭の任意の文字数を【 】で補記
- 著作者名:基本的に冊子版記載通りとしたが、「著作者名別リスト」掲載時に、別名・雅号・通称などは統一名称へ集約した。統一名称の採用にあたっては以下を参照した。
(1) 国立国会図書館 典拠データ検索・提供サービス
(2) VIAF:バーチャル国際典拠ファイル
(3) JapanKnowledge
そのほか、人名辞典類、紳士録、CiNii Research 等
- 著作権による公開基準
3. テキスト化基準
- テキスト
- 文字コードはUnicodeとした。
- 原則として記載通りの文字とした。ただし、以下は置換した。
(1) 旧字 →新字(新旧文字置換対照表 参照)
(2) 合字 →ひらがな等 (例)ゟ →より
(3) 畳字 →ひらがな (例)ゝ、ゞ
(4) ○付き数字 →半角括弧 (例)① →(1)
(5) ローマ数字 →半角アルファベット「I(i)」「V(v)」「X(x)」 (例)Ⅶ →VII、ⅸ →ix
- アルファベット・算用数字は半角、和文中の記号は全角、英文中の記号は半角とした。
- 以下は使用しない。
(1) 機種依存文字
(2) 文字装飾(アンダーライン、強調文字、傍点情報)
- 以下は考慮しない。
(1) 書体
(2) 活字ポイント数
- 以下の場合は補記および訂正を行った。
(1) 冊子版における明らかな誤記・誤植 →該当文字の直後に[ ]で補記
(2) ルビ →該当文字の後ろに《 》で補記
ただし、ルビが熟語や単語中の一部に対するものの場合、検索の便をはかるため、熟語・単語を分断しない位置に挿入
(例)紡《ぼう》績 →紡績《ぼうせき》
(3)【綱文】に表出する以下の部分
年号の欠落部分 →当該箇所に[ ]で補記
連続する年号間の表記「-、―、~、_、・」 →「-」(半角ハイフン)に統一 (例)1872~1889→1872-1889
西暦は4桁表示に統一 (例)15 →1915
- テキスト表示できない文字については、以下の通りとした。
(1) Unicodeが確認できた文字は、コードを{NNNNN}と表示
(例)「U+2B77C」の場合 →{2B77C}
(2) Unicodeが存在しない文字・調査中の文字は、〓と表示
- 判読不能な文字・調査中の文字は、@と表示した。
- 図版・図表
- 図版・図表については、テキスト上表示できない。以下の通り代替表示あるいは目印表示を行った。
(1) 印章、屋号など、テキスト文中に挿入された小サイズの図版 →□印、□図(四角囲み文字「印」、「図」)
(2) 系図、証書など、テキスト文中に挿入された中サイズの図表や図版 →枠線+□図(四角囲み文字「図」)+テキスト…
(3) 統計表、描画、地図、写真など大サイズの図表や図版 →枠線+「図表を画像で表示」ボタン+【この図表に含まれる文字】+テキスト…
(4) (3)の種別(描画、地図、写真)および(3)に含まれる図版 →冒頭あるいは該当箇所に[img図]、[img地図]、[img写真]
- 図版・図表に含まれるテキストは、表出の順番の調整をとっていない。正確な表出の順番を確認する場合は「ページ画像」を参照のこと。
- 「本文公開実験版」 デジタルテキスト化に関する凡例(参考)