목록publaynet (1)
취미가 좋다
PubLayNet : Largest Dataset Ever for Document Layout Analysis
PubLayNet : Largest Dataset Ever for Document Layout Analysis XuZhong, Jianbin Tang, Antonio Jimeno Yepes Overview PubLayNet은 document layout analysis를 위한 데이터셋이다. 문서 이미지와 text, list, figure와 같은 다양한 annotation이 포함된다. 여러 layout들은 bounding box와 polygonal segmentation 형태로 저장되어 있다. 데이터셋은 XML representation과 의학 분야의 백만 개의 PDF article을 자동 매칭하여 만들어졌다. Abstract 구조화되지 않은 디지털 문서의 layout을 인식하는 것은, 문서를 구조화하여 ..
Dataset
2021. 2. 14. 22:56