小町守「自然言語処理の教科書」(技術評論社)のサポートサイトです。
第2章から5章までは演習があります。それぞれの章の演習の Google Colab のリンクです。
- 日本語 BERT モデルによる文書分類
- 最終確認 2025/04/01
- 各自で作成したデータセットで演習いただくつもりでしたが、サンプルデータをダウンロードするように変更しました。
- 機械翻訳の品質推定
- 最終確認 2025/04/01
- 各自で作成したデータセットで演習いただくつもりでしたが、サンプルデータをダウンロードするように変更しました。
- Fast GECToR と cLang-8 による英語誤り検出・訂正
- データの前処理に結構時間がかかり、無料版の Google Colab だと GPU の無料枠を使い切ってしまうようなので、データの前処理部分を別にやるよう Notebook を修正予定です。
- OpenNMT-py によるニューラル機械翻訳演習
- 最終確認 2025/04/01
- fairseq が2022年で開発停止しているので、現在 OpenNMT-py 版しか Google Colab で動かすことができなくなりました。
書籍に載せている演習例は楽天データセットによるものなので配布はできませんが、配布可能なデータセットでのアノテーション例(Google Spreadsheet)を公開予定です。
第1章から第6章までは章末に練習問題があります。それぞれの章の練習問題の回答例を掲載します。
正誤表を掲載します。本に関する誤りを見つけた場合は教えていただけると嬉しいです。
Amazon のページ で購入できます(書籍版、Kindle 版ともにあります)。 EPUB/PDF 版は技術評論社のページから購入できます。