✺
구글 드라이브에 이미지를 올리고 해당 이미지를 오른쪽 클릭해 구글 문서로 전환하면 이미지에 OCR을 걸어 텍스트를 추출하는 기능이 있습니다. 예전에는 좀 문제가 있었는데 2~3년 지난 지금은 어떤가 해서 다시 한번 해봅니다. 과거에는 일본어 세로쓰기 인식이 안되거나 스캐너로 긁은 문서는 몰라도 스마트폰 이미지는 인식이 불량한 경우도 있고 한자는 난이도가 높아 여러모로 불편했습니다. 헌데 최근에 구글 번역앱의 사진 인식 쪽은 매우 잘 되길래 기계학습 이용해 개선했나 싶더군요. 당연히 이 기술이 구글문서로 전환하는 OCR에도 적용 되었을 거라 봤습니다. 일단 동네 도서관에서 일본어 페이지를 하나 찍어 왔습니다. 테스트에는 가로 2000픽셀 넘는 원본으로 올려봤는데 잘 되더군요. 오자 없이 거의 완전하게