静岡県 資料収集

自治体WEBサイトにアップロードされたPDFを自動収集するシステムを地元企業と開発

8/27(土) 11:01配信

静岡県(368万6300人)立中央図書館は、県内の自治体WEBサイトにアップロードされたPDFを自動収集するクローリングシステムを同県三島市のGeolocation Technology社と共同開発した。21年度から県立中央図書館が行っている「図書館DX実証実験」の一環で、マンパワーをかけて収集していたPDFの自動収集が可能になった。公共図書館におけるクローリングシステムの開発は、全国初の取組みという。  昨今自治体資料は、各自治体のWEBサイトの掲載のみで、紙を発行しない例も多くなり、WEBサイトのみの資料は納本の対象外だった。県中央図書館では、人力で収集していたが、収集漏れや職員の負担の削減と効率化を図り、図書館のDX化推進のため同システムを開発した。  クローリング対象は、県内の自治体WEBサイトのドメイン内に格納されたPDFで、Googleドライブで収集した日付ごと、収集元ドメインと同じディレクトリ構造で保存される。また世代管理も行い、収集したPDFをリネームし管理する。これまで収集できたPDFの数は45万5133件。県は、今後収集したPDFを活かしたサービスの可能性を検証していくという。 (月刊「ガバナンス」2022年7月号・DATA BANK2022)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です