Sentence Boundary Detection in Legal Text

アブストラクトの引用です。試訳


文境界検出(SBD)は、あらゆる自然言語処理(NLP)アプリケーションにおいて重要な基本タスクです。なぜなら、エラーは高レベルのタスクに伝搬する傾向があり、SBDエラーが明らかになると、ユーザーは製品全体の正確性と価値に疑問を抱くようになるからです。

SBDは多くの分野で解決済みの問題とされていますが、法的なテキストには独自の課題があります。本稿では、これらの課題について説明し、一般的に使用されている半教師付きのとルールベースのライブラリ、および2つの教師付きシーケンスラベリングアプローチを提案した。

 完全教師付きアプローチが半教師付きルールライブラリよりも優れていることが分かりました。