本サイトでは、LODデータを取得するためのエンドポイント画面を提供しています。
このページでは、エンドポイント画面でのデータ取得方法などの基本的な使い方をご紹介します。

データの取得

SPARQL エンドポイント」を利用して、統計LODのデータを取得する方法をご紹介します。
SPARQLはRDFを用いて定義されたデータを取得するためのクエリー言語です。「SPARQL エンドポイント」では、SPARQLによって記載したクエリーを実行し、データを取得することができます。
なお、データの取得の際に使用するRDFスキーマ情報は、「RDFスキーマ情報」をご参照ください。

統計LODでは、「SPARQL Queryのサンプル」で実行可能ないくつかのサンプルクエリーを提供していますが、そのうち、「新宿区の日本人の人口を求める」クエリーと、「データセットd0003041389の構造(測度、次元、属性)を取得する」クエリーを使って基本的なデータ取得の方法をご紹介します。

「新宿区の日本人の人口を求める」クエリー

2行目はSELECT句で、取得する対象を指定します。
3行目以降は検索条件を指定します。検索条件は、主語、述語、目的語の3つの要素の組合せ(トリプル)で表現します。
(ア)は、データを取得する対象の変数を含んだトリプルです。

lod_img202

ここでは主語はセルIDとなります。このクエリーは人口を取得するためのクエリーですが、セルIDが不明のため、主語(セルID)も変数としています。セルIDは「?s」、人口は「?o」という変数名を付けています。
このため、セルIDと人口をいずれも検索しますが2行目のSELECT句で結果を取得する対象として人口(?o)を指定しているため、クエリーの結果としては人口のみが取得されます。

この条件のみで検索を行うと、登録されている人口全てが取得されます。
そこで、5行目以降で、さらに対象を絞り込みます。次元の値を目的語として設定することで、その条件に合致したデータを取得することができます。

lod_img203

(イ)では、検索対象の地域を指定しています。セルIDについて地域が新宿区であるという定義は、実際のデータは2つのトリプル(主語-述語-目的語の組合せ)によって定義されていますが、ここでは「/」によって2つのトリプルをまとめて1行で表しています。
これはまとめずにそれぞれを記載することも可能です。トリプルごとに記載する場合は以下のようになります。

lod_img204

(ウ)ではさらに検索条件を絞り込みます。

検索条件を複数設定した場合、上記の構文の場合はすべてAND条件(論理積)となります。
そのため、例えば「次元の値」を複数設定するような場合は、OR条件(論理和)で取得するための記述が必要となります。
OR条件(論理和)で取得する場合は「UNION」を使用します。
「新宿区の日本人の人口を求める」クエリーをもとに、OR条件(論理和)で取得するための記述方法の例を以下に示します。次元「男女の別」の次元の値が「男」の場合と「女」の場合の人口を一度で取得する場合のクエリーの例です。

地域について

統計情報は、全て地域(全国も含む)別に観測値を登録しています。
統計LODでは、地域を表すコードとして「統計に用いる標準地域コード」を利用しています。
本サイトでは、統計情報と併せて、地域を表すコードと、1970年4月以降の廃置分合等情報のデータを提供しています。
提供データの概要については、「統計に用いる標準地域コード」をご覧ください。

地域を表すコードと廃置分合等情報について

地域は次元の1つとして定義しています。
地域の情報は、「標準地域コード・エンティティ」と廃置分合等による変更情報を記載した「変更事由・エンティティ」の2つのエンティティ(データのまとまり)で構成されています。

lod_img207

標準地域コードの情報には、廃置分合等による変更に伴い有効期間が存在します。上図の例であれば、A村とB村は2001年3月31日まで存在しますが、2001年4月1日以降は存在しません。また、C町が存在する期間は2001年4月1日から2011年3月31日までになります。

このように、標準地域コード・エンティティは、廃置分合等の施行日を境にそれぞれ別のエンティティとなることから、各エンティティを「期間つき標準地域コード・エンティティ」と呼び、「期間つき標準地域コード」は「<標準地域コード>-<施行年月日>」で表します。
期間のつかない標準地域コードは「簡易標準地域コード」と呼びます。「簡易標準地域コード」については、「期間つき標準地域コード」に対して、最新または過去の期間付き標準地域コードであることを定義します。
なお、標準地域コードは数字5桁で表されますが、統計LODでは先頭に「C」を付加した英数字6桁で表します。

個々の期間つき標準地域コード・エンティティは、そのコードがその期間において指し示す市区町村に関する情報、その期間の前後の期間つき標準地域コード・エンティティへのリンクを持ちます。
また、期間の開始や終了の理由となった廃置分合等情報を指す変更事由・エンティティ(ない場合もあり)へのリンクを持ちます。

lod_img209

変更事由・エンティティは、廃置分合等情報を持つとともに、変更前・後の期間つき標準地域コード・エンティティ(1つまたは複数)へのリンクを持ちます。
例えば、町から市への市制施行の場合には、廃止される町と新設される市のそれぞれの期間つき標準地域コード・エンティティに1つずつ(計2つ)のリンクを持ちます。また、市と町の間での境界変更の場合では、市と町に係る新旧それぞれの期間つき標準地域コード・エンティティに1つずつ(計4つ)のリンクを持ちます。

期間つき標準地域コード・エンティティと変更事由・エンティティの関係を、春日部市の合併、市制変更を例にして下図に示します。

lod_img211

行政単位の定義について

標準地域コード・エンティティは、市区町村に関する情報として行政単位を持ちます。
行政単位は、都道府県、特別区部、郡、支庁・振興局、市、町、村、区及び特別区に区分されており、行政単位間の階層関係や集約関係を定義しています。
行政単位間の関係は下図の通りとなっています。

lod_img212

なお、階層関係は行政単位の各要素に対して定義し、集約関係は個々の期間つき標準地域コードに対して定義しています。それぞれのデータ構造のイメージを下図に示します。

lod_img213