BODIK Utility(10) 住所の正規化(試作版)ベースレジストリ対応

この前作った住所の正規化ツールですが、自治体標準データセットの「町字ID」に対応できていませんでした。

BODIK Utility(10) 住所の正規化(試作版)

デジタル庁から自治体が公開するオープンデータの定義として「自治体標準データセット(試験公開版)」が発表されました。その中で、住所は正規化して細分化(都道府県、…

これをどうにかしたいなと、考えてみました。

  • 「町字ID」は、今年4月にデジタル庁が発表した「アドレス・ベース・レジストリ」の中にあったはず。
  • ISITでは、デジタル庁のベース・レジストリをAPI化(DAPIと呼んでいます)していて、REST-APIとして検索できる
  • これを使えば行けるのではないか?

DAPIについては次の記事をご参照ください。

WAPIの仕組みでデジタル庁のサイトをAPI化してみた

2022年4月22日、デジタル庁が「ベースレジストリ・データカタログサイト」を公開しました。 デジタル庁のお知らせ:https://www.digital.go.jp/news/KgQ8ac8h/ 「ベースレ…

今回、住所の正規化ツールに、次のような機能を追加しました。

  1. 正規化した住所(都道府県、市区町村、町)を分解して、DAPIのパラメータに合わせて整形する
  2. DAPIを使って、アドレス・ベース・レジストリの「町字マスター」を検索する
  3. 見つかった情報から、「全国地方公共団体コード」と「町字ID」を取得する
    • 現時点で、アドレス・ベース・レジストリから見つからないケースがあります
    • 住所の正規化と分解に問題があると認識しています
  4. 正規化した住所と一緒に表示する

デジタル庁からも「推奨データセット」から「自治体標準データセット」へ変換するコンバータを提供予定とありますが、とりあえず、今できる範囲で対応してみましたので、ご興味がありましたら、お試しください。

住所の正規化ツール

ひらの