目的 DBNetの理論を学習した際の備忘録。 OCRを行おうと思い、まず一般的なモデルについて確認したかったが、あまり説明記事が無かったのでまとめてみました。 参照 原論 Liao, M., Wan, Z., Yao, C., Chen, K., & Bai, X. (2019). Real-time Scene Text Detection with Differentiable Binarization. ArXiv. /abs/1911.08947 DBNet(Differentiable Binarization)とは 2019年に発表されたOCRのためのモデル。 1番重要なのは、positiveとnegativeを判断する閾値のマップを深層学習で作成して組み込んだ点。 モデル概要 下図が一般的なOCRモデル(青線)とDBNet(赤線)のinputからoutputへの流れになってい
