本文へスキップ

A Freely Available Record Linkage System with a Graphical User Interface

Febrl (Freely Extensible Biomedical Record Linkage) とは

疫学研究・臨床研究における,2次情報(secondary data)を利用した研究の多くでは,複数の異なる情報源からのデータをリンクして,曝露・治療やアウトカム,交絡要因についての情報を収集し,統計解析が行われることが一般的です.これらの研究では,複数のデータベースにおける同一個人の情報を正確にリンクすることが不可欠であり,科学的な妥当性を担保するための必須の要件となりますが,個人を識別するための確実な情報(例えば,個人の識別番号など)は必ずしも利用できないのが一般的です.
このような場合,次善の策として,それぞれのデータベースに記録されている変数の情報を照らし合わせて,個々人のデータを可能な限り精確にマッチングさせ,リンクする試みが行われます.当然ながら,限られた情報から,大規模なデータベースにおいて,個人を100%正確に識別することは不可能であるため,その不確実性も考慮した連結の方法が必要とされることになります.これらのデータベースを連結するための方法論・計算アルゴリズムは,レコードリンケージ(record linkage)といわれ,統計学・情報科学の分野で広く研究されてきました.
レコードリンケージを行うためのソフトウェアや計算モジュールは,海外の研究者によって,多くの高機能なものが開発されていますが,高度なプログラミング技術やコンピュータに関する専門的な知識が必要とされるものが多く,医学研究に携わる研究者や実務家には,その扱いは必ずしも容易ではありませんでした.
Febrl (Freely Extensible Biomedical Record Linkage) は,Australian National Universityのコンピュータ科学部門によって開発されたフリーのソフトウェアで,データのクリーニング・標準化から,最新の高度な連結アルゴリズムまでを幅広くカバーした,高機能なレコードリンケージのソフトウェアとなっています.また,Febrlは,Graphical User Interface (GUI)によるシステムを採用しており,Microsoft Excelのような表計算ソフトと同じような直感的な操作で,上記のような高度なリンケージのアルゴリズムを容易に実行できるように設計されています.
本ホームページでは,Australian National Universityの開発グループの許諾のもと,Febrlを日本語対応したものを公開しております.日本語対応Febrl(ver 0.4.2)は,フリーソフトウェアであり,使用,転載,及び配布に制限はなく,無償でご利用いただけます.
なお,当ソフトウェアの開発は,平成25-27年度厚生労働科学研究費補助金(健やか次世代育成総合研究事業)「今後の小児慢性特定疾患治療研究事業のあり方に関する研究」の一環として行われました.

Links:
Australian National University (ANU) Data Mining Group
ANU Data Mining Group: Parallel Large Scale Techniques for High-Performance Record Linkage
Febrl Release 0.4 (ANU Data Mining Group)

小児慢性特定疾病情報センター

〒157-8535
東京都世田谷区大蔵2-10-1
国立成育医療研究センター内
小児慢性特定疾病情報センター
TEL:03-3416-0181(代表)
ダイヤルイン 03-3416-0181(内線:7370)
FAX:03-3417-2694