HWP/HWPX 파일에 포함되어 있는 "표, 도형, 이미지 처리" 등은 AI가 인식하기 어려운 듯 한데 어떻게 문서 작업을 하는게 좋을까요?

우리가 흔히 사용하는 한글(HWP, HWPX)이나 워드(DOC, DOCX) 파일은 단순히 글자만 들어 있는 파일이 아닙니다.

문서 그대로 AI에게 입력할 수도 있지만 문서파일은 문서의 모양을 꾸미는 서식, 표, 이미지 등 방대한 정보를 포함하고 있어
AI에게 가공되지 않은 문서 데이터 전체를 그대로 입력하는 것은 비효율적입니다.

이 때문에 AI가 정보를 빠르고 정확하게 학습할 수 있도록, 문서 데이터를 미리 깔끔하게 정리하는 전처리 과정이 필수입니다.
ex) 표나 이미지가 삽입된 경우 문서 본문 내용에 표, 이미지등을 AI가 인지할 수 있도록 설명 내용을 추가하는 등의 전처리 과정

한글과컴퓨터는 AI가 데이터를 더 쉽게 활용할 수 있도록 데이터 추출이 용이한 HWPX 포맷을 도입하였습니다.

또한 한글 문서 서식에 최적화된 데이터 추출도구(DataLoader)를 개발하여 제공하여 AI친화적인 문서 생태계를 구축하기 위해 노력하고 있습니다.

그 대표적인 예로 '한컴 데이터로더'라는 솔루션이 있습니다.
만약 솔루션 도입을 원하실 경우 아래 링크를 통해 도입 문의를 남겨주시기 바랍니다.

솔루션 도입문의 바로가기

 

찾으시는 항목이 없나요? 지원센터에서 문제해결에 적합한 도움을 받아 보세요.

구매하신 제품문의는 한컴스토어 로그인 후 제품 문의하기를 통해 질문을 남기실 수 있어요.

Footer

  • 회사개요
  • 오시는 길
  • 윤리경영
  • 사회공헌
  • IR

한글과컴퓨터 약관

개인정보처리방침이용약관

그룹사 선택

(주)한글과컴퓨터대표자: 변성준, 김연수
사업자등록번호: 107-81-522302012-경기성남-1092
경기도 성남시 분당구 대왕판교로644번길 49 한컴타워 10층
고객 지원: 1566-5192(국내, 평일 9시-18시)support@hancom.com
사업자정보 확인
ISMS-P 인증

[인증범위] 생산성서비스 및 채용서비스
[유효기간] 2025.04.20~2028.04.19

2023 올해의 브랜드 대상ISO27001&27701_인증마크

Copyright © HANCOM Inc. All rights reserved.