Geolonia、住所データの表記ゆれと座標化を解決する「クイック住所変換」

 Geoloniaは8月16日、住所正規化+緯度経度追加サービス「クイック住所変換」の提供を開始したと発表した。

 
 

 クイック住所変換は、住所データを取り扱う際の大きな課題である「表記ゆれ」と「座標化」を解決するサービス。対象とする元データは、デジタル庁が整備を進めるアドレスベースレジストリおよび、法務省が公開する登記所備付地図データ、国土交通省の位置参照情報となる。また、ベースレジストリ22,501,162件、登記所データ245,168,664件、位置参照情報277,656件の合計267,947,482件のデータ量をベースに正規化変換とジオコーディングを実施している。

 
 

 表記ゆれをしている住所を含むExcel(.xlsx)ファイル、CSVファイル(.csv)をアップロードすると、正規化(使いやすい統一されたフォーマットの表記に変換)済みの住所と、座標が付与されたデータがダウンロードできるのが特徴。

 物流、不動産、マーケティング、アナリティクスの分野では、多くの住所データが扱われている。しかし、住所の書き方(漢字、ひらがなカタカナ、英語表記)や分割の仕方が異なるといった理由で表記ゆれ(「東京都千代田区永田町1丁目7-1」や「東京都千代田区永田町1-7-1」、「東京都千代田区永田町一丁目7番1号」など)が起こるほか、緯度経度の座標への変換コストの高さなどが問題になっている。

 
 

 同社によると、正規化やジオコーディングのプロセスを組み込むことで、会員名簿、CRMやSAの顧客リスト、配送先リスト、店舗リスト、施設管理シート、マーケティングデータなど、住所を含むデータの精度が向上できるという。

 なお、正規化では、受けとった住所を都道府県、市区町村、住所1(丁目レベル)、住所2(号レベル+建物名他)に分割できるほか、市区町村名に含まれる「ケ」「の」「ツ」のバリエーションを理解し、住所マスタに登録された文字へと変換する。

 また、「河原町通四条上る」などの京都の通り名は削除され、都道府県や郡が抜けていても、都道府県や郡を補完した上で正規化できる。北海道の「条」表記にも対応するほか、郡の名前が省略されている住所に対しては、それを補完。住所に含まれるアルファベットと数字を半角に統一し、「大字」などの表示を削除して標準的な表記に合わせるという。

 さらに、新字体と旧字体のゆらぎ、「ケが」「カか力」「之ノの」「ッツっつ」などのゆらぎ、「釜と竈」「埠頭とふ頭」などの漢字のゆらぎを吸収し、国交省の位置参照情報に記載されている地名にあわせられる。町丁目レベルに記載する数字については、国交省の位置参照情報にあわせて、すべて漢数字に変換。番地や号レベルに記載されている数字はアラビア数字に変換し、番地などの文字列は「-」に変換する。正規化できなかった住所については、マッチングレベルやエラーの内容を付与して戻されるという。

 ユーザー登録や事前申請などは不要で、クレジット決済(Stripe)に対応。必要なタイミングに個人でも法人でも利用可能となっている。料金はスタンダードの1000件まで5000円から。料金の基本表示はジオコーディング込みとなっており、オプションを外すことで半額料金で正規化のみも可能となっている。

 今後は、国によるデータの追加や更新に歩調を合わせ、精度の向上や機能追加を続けていくとしている。

クイック住所変換

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]