[로이슈 편도욱 기자] 한글과컴퓨터(이하 한컴)는 오픈소스 기반 PDF 데이터 추출 도구인 '오픈데이터로더(OpenDataLoader) PDF v2.0'을 12일 공개했다. 회사 측은 자체 벤치마크 테스트에서 해당 도구가 읽기 순서, 표, 제목 추론 등 여러 분야에서 1위 성능을 기록했다고 밝혔다.
이번 버전은 인공지능(AI) 방식과 직접 추출 방식을 결합한 하이브리드 엔진을 적용한 것이 특징이다. 외부 서버로 데이터를 전송하지 않고 로컬 환경에서 모든 처리가 가능하도록 설계됐다.
또한 이미지 기반 PDF와 스캔 문서의 텍스트를 인식하는 광학문자인식(OCR), 표 구조 분석, 수식 추출, 차트 분석 기능을 수행하는 무료 AI 애드온 4종이 기본으로 탑재됐다. 이 애드온들은 도클링(Docling) 등 타사 오픈소스 AI 모델과 호환되어 사용될 수 있다.
한컴은 이번 버전 출시와 함께 오픈소스 라이선스를 기존 MPL 2.0에서 아파치 2.0(Apache License 2.0)으로 변경했다. 상업적 활용이 자유로운 라이선스로 전환해 개발자와 기업의 사용 편의성을 높이고 생태계 확장을 도모한다는 계획이다.
회사는 향후 랭체인(LangChain) 등 다양한 AI 프레임워크와의 연동을 확대하고, 2026년 하반기에는 상용 AI 애드온을 출시할 예정이다. 아울러 문서 구조를 분석해 접근성 태그를 자동 생성하는 기술을 개발, 글로벌 접근성 표준을 충족하는 솔루션으로 확장한다는 방침이다.
정지환 한컴 최고기술책임자(CTO)는 "오픈데이터로더 PDF v2.0은 누구나 자유롭게 활용하고 확장할 수 있는 개방형 PDF 데이터 플랫폼으로 진화했다"며 "향후 상용 AI 애드온과 접근성 솔루션을 통해 글로벌 생태계를 선도해 나가겠다"고 말했다.
편도욱 로이슈 기자 toy1000@hanmail.net
한글과컴퓨터, 오픈소스 PDF 데이터 추출 도구 '오픈데이터로더 v2.0' 공개
기사입력:2026-03-12 21:20:41
<저작권자 © 로이슈, 무단 전재 및 재배포 금지>
로이슈가 제공하는 콘텐츠에 대해 독자는 친근하게 접근할 권리와 정정ㆍ반론ㆍ추후 보도를 청구 할 권리가 있습니다.
메일:law@lawissue.co.kr / 전화번호:02-6925-0217
메일:law@lawissue.co.kr / 전화번호:02-6925-0217
주요뉴스
핫포커스
투데이 이슈
투데이 판결 〉
베스트클릭 〉
주식시황 〉
| 항목 | 현재가 | 전일대비 |
|---|---|---|
| 코스피 | 5,583.25 | ▼26.70 |
| 코스닥 | 1,148.40 | ▲11.57 |
| 코스피200 | 827.51 | ▼6.54 |
가상화폐 시세 〉
| 암호화폐 | 현재가 | 기준대비 |
|---|---|---|
| 비트코인 | 102,992,000 | ▲508,000 |
| 비트코인캐시 | 669,500 | ▲3,000 |
| 이더리움 | 3,032,000 | ▲24,000 |
| 이더리움클래식 | 12,100 | ▲70 |
| 리플 | 2,021 | ▲7 |
| 퀀텀 | 1,292 | 0 |
| 암호화폐 | 현재가 | 기준대비 |
|---|---|---|
| 비트코인 | 103,030,000 | ▲484,000 |
| 이더리움 | 3,032,000 | ▲20,000 |
| 이더리움클래식 | 12,100 | ▲60 |
| 메탈 | 406 | ▲1 |
| 리스크 | 190 | ▲1 |
| 리플 | 2,022 | ▲7 |
| 에이다 | 385 | ▲1 |
| 스팀 | 87 | ▲0 |
| 암호화폐 | 현재가 | 기준대비 |
|---|---|---|
| 비트코인 | 102,990,000 | ▲570,000 |
| 비트코인캐시 | 667,500 | ▲1,500 |
| 이더리움 | 3,033,000 | ▲27,000 |
| 이더리움클래식 | 12,100 | ▲100 |
| 리플 | 2,020 | ▲7 |
| 퀀텀 | 1,284 | 0 |
| 이오타 | 93 | 0 |







