Islands in the byte stream

Technical notes by a software engineer

保育所の公式データは統一されたフォーマットで提供してほしい

三行まとめ

  • 保育所*1の電子化データは提供元によってファイル形式もデータの構造も異なるためプログラムで加工しにくい
  • 東京都の場合、認可保育所一覧はそれぞれの区が管理しており探すのが大変
  • 保育所のデータはプログラムで加工しやすい統一されたフォーマットで提供してほしい

保育所データの現状

保育所を検索するAndroidアプリでも作ってみるかなと思って保育所のデータを探しているのですが、いまのところプログラムで簡単に加工できるデータを見つけられていません。

たとえば、東京都の場合、代表的な保育所の種類としては「認可」「認証」「認可外」などがあります。

認可保育所の一覧は23区などの自治体が提供しているため、それぞれの区のサイトを探す必要があります。

たとえば港区と目黒区をみるとこんな感じです:

他の区は調べていませんが、上記三区と同じように区ごとにまったく異なる方式で提供されていると思われます。

認証保育所は都内の一覧があります。

認可外保育施設も同様に一覧はありますが、認可・認証と同様に利用できる「保育所」でないものも含むため、認可・認証の保育所とは比較できないかもしれません*2

このように、ファイル形式や提供されている情報、あるいは分類方法も区ごと・保育所の種類ごとにバラバラなため、プログラムで電子化データとして加工するのは非常に手間がかかります。プログラムで処理するよりもクラウドソーシングなどのほうが簡単なのではないかと思えるほどです。

一覧データを販売している施設サイトもあるにはありますが、一次情報は公開されているのでできればそれを利用したいところです。

(追記) 全保育所の一覧らしきものはありました。
東京都福祉保健局 > 福祉保健の基盤づくり > 社会福祉法人・施設情報 > 社会福祉施設等一覧 > 施設等一覧
http://www.fukushihoken.metro.tokyo.jp/kiban/fukushi_shisetsu/shs_list/shisetsuitiran.html (Excel)

なぜプログラムで加工しやすいことが重要か

保育所を必要とする人が適切な保育所を探すコストを減らすためです。

プログラムで加工しやすい電子データがあれば、低コストで信頼性のたかい関連サービスやアプリを作れます*3。関連サービスというのは、たとえば保育所検索サイトや口コミサイトなどです。今は基本的に自治体が配布している冊子を眺めてメモを取りながら保育所を探すというのが一般的なフローだと思いますが、これは非常にコストの高いタスクです。質のよい検索サイトがあればその時間を大幅に削減できるはずで、それはとりもなおさず子育てのコスト自体を減らすことにつながります。

保育所データに望むこと

ファイル形式はCSVで、純粋にデータとして提供してほしい

  • Excelで提供されているデータも少しありますが、PDFの原本として使われるためか余計な文章(見出し、注意書き)が入っていてプログラムでは加工しにい状態です
  • 純粋に保育所一覧データのみのCSVとして提供されるとプログラムで加工しやすいので助かります

提供されるデータの質の統一

  • 現状、提供されているデータで共通なのは名前と住所と電話番号くらいで、そのほか収容人数や種類(=認可・認証など)、経営主体などは提供されていることもあれば、されていないこともあります
  • データの提供元(=区や都などの自治体)が違っても同じ質のデータを得られるとプログラムで加工しやすいので助かります

提供されるデータへの統一されたアクセス

  • 現状、区や都のサイトを探し回らないといけないため、非常に時間がかかります
  • 都道府県のウェブサイトの1ページで全保育所の一覧にアクセスできるとデータの収集が簡単で助かります

*1:保育園

*2:認可外保育施設について http://www.fukushihoken.metro.tokyo.jp/kodomo/hoiku/ninkagai/qa.html

*3:東京都の保育所検索アプリは、iPhone用はあるようですが、Android用は見つけられませんでした。