提供データのリニューアルのお知らせ(2017年10月19日)

統計LODでは、提供データの追加、及び定義の変更を行いました。

提供データの追加

以下のデータを新たに提供しています。

国勢調査(平成27年)
  • 人口等基本集計(男女・年齢・配偶関係、世帯の構成、住居の状態など)
    • 年齢(各歳)、男女別人口-都道府県、市区町村別
    • 国籍(12区分)、男女別外国人数-都道府県、市区町村別
提供データの詳細は、提供する統計表一覧のページをご覧ください。
 
社会・人口統計体系
  • 都道府県については、全分野(人口・世帯、自然環境、経済基盤、行政基盤、教育、労働、居住、健康・医療、福祉・社会保障など)の基礎データを提供しています。
  • 市区町村については、主要3分野(人口・世帯、経済基盤、行政基盤)の基礎データを提供しています。
提供データの詳細は、提供する統計表一覧のページをご覧ください。
また、社会人口統計体系で提供している項目の一覧は社会人口統計体系の指標一覧に記載しています。
・社会人口統計体系の指標一覧(Excel形式CSV形式

 

提供データの変更

提供データについて、以下の通り見直しを行いました。

データセットの見直し
e-Statの統計データベースと名称を合わせるため、下記のデータセットについて、一部の観測値の入れ替えを行いました。
  • 世帯年齢区分(6歳未満・12歳未満・15歳未満・18歳未満・20歳未満世帯員のいる世帯)、家族類型、世帯人員別一般世帯数-都道府県、市区町村別
  • 住居の種類・住宅の所有の関係、延べ面積、高齢世帯員の有無による世帯の類型別一般世帯数-都道府県、市区町村別
  • 世帯年齢区分(65歳以上世帯員のいる世帯)、世帯人員別一般世帯数-都道府県、市区町村別
国勢調査の登録対象の見直し
旧市区町村のデータについては登録しないこととしました。
 
労働力調査の次元の見直し
次元「産業分類(労働力調査)」については、総数(total)のみしか次元の値がないため、次元を付与しないこととしました。
 
セルIDの見直し
観測値のセルID(URI)の生成方法を変更し、統計表の分類項目から生成したハッシュ値(英数字32文字)をセルIDとすることとしました。

 

統計LODの定義の変更

利用しやすさ等を考慮し、統計LODの各定義内容について、以下のような見直しを行いました。
なお、URIの変更内容についてはURI変更一覧に記載しています。
・URI変更一覧(Excel形式
また、変更したURIについては、変更前URIから変更後URIに対して、「dcterms:isReplacedBy」を定義しています。
Turtleファイルは定義ファイルダウンロードのページからダウンロードできます。

URI体系の見直し
統計表に関する定義と、次元や測度などのデータキューブを構成する語彙の定義について、以下のようにURIの体系を分けました。
  • 統計表に関する定義:「http://data.e-stat.go.jp/lod/」の下に定義
  • データキューブを構成する語彙の定義:「http://data.e-stat.go.jp/lod/ontology/」の下に定義
URIの命名規則の見直し
URIに「制定年」を付与する場合のルールを明確にし、crossDomainに定義する次元については、原則として「制定年」を付けないこととしました。
なお、crossDomainに定義する次元のうち、改定年等が明確な場合(例:日本標準産業分類)は、次元の語彙に制定年を付けることとしました。
また、URIに政府統計を含む場合は、政府統計名の英語表記ではなく、政府統計コードを使用することとしました。(例:国勢調査の場合「populationCensus」を「g00200521」に変更)
 
URIの見直し
測度、次元、次元の値等を中心に、入力の手間等を考慮し、URIを短くしました。
次元の値の「総数」について、他の次元の値を足し合わせた値ではない場合もあるため、「-total」を「-all」に変更しました。
 
データセット構造におけるブランクノード使用の見直し
データセット構造の定義において、ブランクノードを用いた記述を行なっていましたが、検索の容易性等を考慮し、ブランクノードを使用しない記述方法に変更しました。
 
測度(mesure)の見直し
各機関が利用する場合を考慮し、測度の定義を汎用的にしました。例えば「人口」「就業者数」など、人数を表す測度は「人数」として統一しました。
また、各測度は、政府統計別ではなく、すべて「http://data.e-stat.go.jp/lod/ontology/measure/」の下に定義し、制定年についても付与しないこととしました。
 
単位(unitMeasure)の見直し
単位について、『単位』と『助数詞』に分け、『助数詞』の場合は単位の定義を付与しないこととしました。(ただし、「人」「世帯」については「単位」として扱います)
また、測度の内容を詳細に表す必要がある場合は、単位としてその内容を定義することとし、測度「指数」の内容を表す単位「消費者物価指数」を追加しました。
 
identifierの定義内容の見直し
属性、及び次元の「dcterms:identifier」の定義について、内部的な番号を付与していたために削除し、標準的なコードがある場合のみ定義することとしました。
 
地域を表す次元の見直し
地域を表す次元について、統計LODの独自語彙「cd-dimension:standardAreaCode」から、「sdmx-dimension:refArea」に変更しました。
 
統計に用いる標準地域コードの見直し
統計に用いる標準地域コードについて、以下の変更を行いました。
  • 簡易標準地域コードと、期間つき標準地域コードのリンクについて、「owl:sameAs」を、「sacs:latestCode(最新の期間つき標準地域コード)」「sacs:pastCode(過去の期間つき標準地域コード)」に変更する
  • 期間つき標準地域コードについて、所属する都道府県名を「sacs:prefectureLabel」で定義する
IPA共通語彙の利用の見直し
IPA共通語彙との連携方法について、以下の変更を行いました。
  • 期間つき標準地域コードについて、「ic:都道府県」「ic:市区町村」は「ic:住所型」であり期間付き標準地域コードに付与するのは不適切であるため定義しない
  • 期間つき標準地域コードのタイプ(rdf:type)として「ic:コード型」を定義する
  • 期間つき標準地域コードについて、「ic:識別子」「ic:表記」を定義する
  • 「期間付き標準地域コード(http://data.e-stat.go.jp/lod/sac)」というURIを新規に作成し、期間つき標準地域コードの「ic:コード種別」として定義する
  • 「期間付き標準地域コード(http://data.e-stat.go.jp/lod/sac)」に「ic:名称」「ic:発行者」「ic:バージョン」を定義する
  • 期間つき標準地域コードの階層関係の定義として、「ic:上位コード」「ic:下位コード」を定義する