AI 품목분류: 무역 데이터 자동화의 핵심
무역에서 HS코드(Harmonized System Code) 분류는 관세율 결정, 무역 통계 산출, FTA 원산지 판정의 기초입니다. 전 세계 5,000개 이상의 6단위 HS코드와 각국 10단위 세분류를 정확히 매핑하는 것은 무역 실무의 가장 전문적인 영역 중 하나로, AI를 통한 자동 분류가 DX혁신의 핵심 과제로 부상했습니다.
KOTRA DX혁신랩에서는 NLP(자연어처리) 기반의 품목 자동 분류 모델을 개발하여, 제품 설명 텍스트만으로 HS코드를 자동 추정하고, MTI(무역통계품목분류)·SITC (국제표준무역분류)와의 교차 변환까지 지원하는 시스템을 구축했습니다.
무역 품목분류 체계 이해
글로벌 무역에서 사용되는 품목분류 체계는 목적에 따라 여러 종류가 있습니다. AI 자동 분류 모델은 이들 분류 체계 간의 매핑 관계를 학습하여, 하나의 입력으로 다수의 코드를 동시에 추정할 수 있습니다.
| 분류 체계 | 관리 기관 | 코드 구조 | 주요 용도 |
|---|---|---|---|
| HS (Harmonized System) | WCO (세계관세기구) | 6단위 (각국 10단위) | 관세 부과·통관·원산지 |
| MTI (무역통계품목분류) | KITA (한국무역협회) | 6단위 | 한국 무역 통계·분석 |
| SITC (국제표준무역분류) | UN (유엔) | 5단위 | 국제 비교 통계 |
| BEC (광의경제분류) | UN (유엔) | 3단위 | 경제 분석·산업 연관 |
| CPC (중심생산물분류) | UN (유엔) | 5단위 | 서비스·상품 통합 분류 |
AI 분류 모델 아키텍처
AI 품목분류 모델은 3단계 계층 분류(Hierarchical Classification) 방식을 채택합니다. HS코드의 계층 구조(류→호→소호)를 반영하여, 상위 분류부터 하위 분류로 순차적으로 좁혀나가는 방식으로 분류 정확도를 높입니다.
학습 데이터와 모델 성능
AI 품목분류 모델의 정확도는 학습 데이터의 품질과 양에 크게 의존합니다. KOTRA DX혁신랩은 관세청 500만 건 이상의 실제 통관 데이터를 확보하여 모델을 학습시켰으며, 산업별 특화 사전과 유의어 DB를 구축하여 도메인 정확도를 높였습니다.
| 분류 단계 | 코드 수 | Top-1 정확도 | Top-3 정확도 | 주요 오류 원인 |
|---|---|---|---|---|
| 류(2단위) | 97개 | 96% | 99% | 유사 류 간 경계(예: 84류 vs 85류) |
| 호(4단위) | 1,200+개 | 89% | 95% | 제품 설명 모호성 |
| 소호(6단위) | 5,300+개 | 82% | 91% | 세부 스펙 부족 |
| 10단위(한국) | 12,000+개 | 75% | 88% | 국가별 세분류 차이 |
실무 활용: 방글라데시 교역 품목 분류
한-방글라데시 교역에서 AI 품목분류는 특히 유용합니다. 방글라데시의 관세 체계는 한국과 HS코드 세분류가 다르고, 추가 관세(CD, SD, VAT, AIT, AT) 부과 체계가 복잡하여, 정확한 HS코드 확인이 비용에 직접적인 영향을 미칩니다.