[사건의내막 / 문홍철 기자] = 행정안전부가 2028년까지 인공지능(AI) 기업이 활용할 수 있는 고가치 공공데이터 100여 개를 단계적으로 개방한다.
올해는 신산업·K-문화·재난안전·AI학습 분야의 핵심 데이터 25종을 선정해 12월까지 순차 공개하며, 합성데이터 기술을 활용해 개인정보 보호와 데이터 활용성을 동시에 높인다.
행정안전부는 국내 인공지능 기업의 경쟁력을 강화하고 신산업 육성을 지원하기 위해 'AI·고가치 공공데이터 TOP 100' 가운데 올해 개방할 25개 데이터의 세부 사업계획을 확정하고 본격적인 개방에 나선다고 1일 밝혔다.
이번에 선정된 데이터는 지난해 실시한 800여 개 기업 대상 방문조사와 대국민 온라인 수요조사를 통해 발굴한 3280여 개 후보 과제 가운데 경제적 파급효과, 국정과제 연계성, AI 활용 가능성 등을 종합적으로 평가해 결정했다.
외부 전문가 심의를 거쳐 최종 선정된 데이터는 올해 말까지 공공데이터포털을 통해 순차적으로 제공된다.
행안부는 지난해 10개 데이터 개방에 이어 올해 25개, 2027년 30개, 2028년 35개를 추가 개방해 2028년까지 총 100여 개의 고가치 데이터를 확보한다는 계획이다.
◆ 신산업·K-문화·재난안전 분야 핵심 데이터 개방
올해 개방되는 데이터는 민간의 신규 서비스 창출과 산업 경쟁력 강화에 직접 활용될 수 있는 4대 핵심 분야 중심으로 구성됐다.
|
▲ 2025년 기개방 공공데이터 활용 주요 사례(자료=행정안전부) ©
|
신산업 분야에서는 한국에너지기술연구원의 '재생에너지 기술잠재량 데이터'를 제공한다. 태양광·풍력·수력·해양·바이오매스·폐기물·지열 등 7종 재생에너지의 발전 잠재량을 위·경도와 행정구역 단위로 공개해 민간 기업의 사업성 분석과 투자 판단을 지원한다.
K-문화 분야에서는 한국문화정보원의 '문화 분야 AI 학습데이터'를 개방한다. 전통 건축물 단청 문양의 3차원 모델링 데이터와 2차원 이미지, 유물의 시대 코드와 상징 의미, 설명 자료 등을 포함하고 있다. 고증을 거친 데이터를 제공함으로써 생성형 AI가 우리 문화를 왜곡하는 사례를 줄이고 게임·관광·문화콘텐츠 산업 활성화에 기여할 것으로 기대된다.
재난·안전 분야에서는 국토안전관리원의 '특수교량 안전 점검 및 관리 데이터'를 공개한다.
현수교와 사장교 등의 손상 이미지와 손상 유형·원인·보수 방안, 차량 통행 탐지 정보 등을 제공해 이상 징후를 조기에 발견하고 유지관리 효율성을 높일 수 있도록 지원한다.
AI 학습 분야에서는 공정거래위원회와 농촌진흥청의 데이터가 포함됐다.
'공정거래위원회 의결서 AI 학습데이터'는 공정거래법 위반 사건 등에 대한 위원회 의결 내용을 AI가 학습할 수 있도록 구조화한 자료다. 의결 요약, 사실관계, 판단 내용, 관련 법령 등을 체계적으로 정리해 기업의 계약 검토나 영업 리스크 분석 서비스를 개발하는 데 활용될 전망이다.
일반 국민과 소상공인도 복잡한 불공정거래 여부를 보다 쉽게 확인할 수 있는 서비스 개발이 가능해질 것으로 기대된다.
농촌진흥청의 '농작물 병해충 진단 데이터'는 병해 증상과 해충의 성충·유충 이미지, 상세 설명 자료를 결합해 제공한다. 이를 활용한 AI 진단 서비스가 개발되면 병해충을 조기에 발견해 농가 생산성을 높이고 적기 방제를 통해 농약 오남용을 줄이는 데 도움이 될 것으로 예상된다.
◆ 합성데이터 활용 확대…개인정보 보호와 산업 활용성 동시 확보
행안부는 이번 데이터 개방 과정에서 개인정보 보호를 위해 합성데이터 기술을 적극 활용한다.
가족·청소년 분야 전화 상담 데이터와 운수종사자 자격관리 데이터 등 개인정보가 포함된 자료는 원본 데이터의 구조와 분포 특성을 반영한 합성데이터 형태로 가공해 제공한다.
이를 통해 개인정보 침해 우려를 최소화하면서도 기업과 연구기관이 데이터를 안전하게 활용할 수 있도록 지원할 계획이다.
앞서 행안부는 건물 화재 대응시설 데이터, 교통카드 이용 내역 합성데이터, 중앙행정기관 법령해석 및 특별행정심판 재결례 등을 개방해 숙박·교통·법률 분야의 다양한 민간 서비스 창출을 지원해 왔다.
특히 교통카드 이용 내역을 합성데이터로 제공하고 법령 질의·응답 사례를 AI 학습이 가능하도록 구조화한 사례는 공공데이터 개방의 대표적 성과로 평가받고 있다.
윤호중 행정안전부 장관은 "AI 기업이 필요로 하는 데이터를 신속하게 개방해 기업 성장을 적극 뒷받침하겠다"며 "추가 수요조사를 통해 학습용 데이터를 지속 확대하고 AI 친화적 공공데이터 관리체계로 전환해 글로벌 AI 3대 강국 도약을 지원하겠다"고 밝혔다.
penfree1@hanmail.net
*아래는 위 기사를'구글 번역'으로 번역한 영문 기사의[전문]입니다. '구글번역'은 이해도 높이기를 위해 노력하고 있습니다. 영문 번역에 오류가 있을 수 있음을 전제로 합니다.<*The following is [the full text] of the English article translated by 'Google Translate'. 'Google Translate' is working hard to improve understanding. It is assumed that there may be errors in the English translation.>
Opening 'High-Value Public Data' to AI Companies… 100 Types by 2028
25 Types of High-Value Data Selected Through Private Sector Demand Survey to be Provided Sequentially Within the Year
[Inside Story / Reporter Moon Hong-cheol] = The Ministry of the Interior and Safety will gradually open approximately 100 types of high-value public data that can be utilized by artificial intelligence (AI) companies by 2028.
This year, 25 types of core data in the fields of new industries, K-culture, disaster safety, and AI learning have been selected and will be released sequentially by December. Synthetic data technology will be utilized to simultaneously enhance personal information protection and data usability.
The Ministry of the Interior and Safety announced on the 1st that it has finalized detailed business plans for the 25 data sets to be opened this year from the 'AI & High-Value Public Data TOP 100' to strengthen the competitiveness of domestic AI companies and support the nurturing of new industries, and is embarking on the full-scale opening process. The data selected this time was determined by comprehensively evaluating factors such as economic ripple effects, alignment with national policy tasks, and potential for AI utilization among approximately 3,280 candidate projects identified through on-site visits to over 800 companies and a nationwide online demand survey conducted last year.
The data, finally selected following deliberation by external experts, will be provided sequentially through the Public Data Portal by the end of this year.
Following the opening of 10 datasets last year, the Ministry of the Interior and Safety plans to open an additional 25 this year, 30 in 2027, and 35 in 2028, aiming to secure a total of approximately 100 high-value datasets by 2028.
◆ Opening of Core Data in New Industries, K-Culture, and Disaster Safety Sectors
The data being opened this year is organized around four key sectors that can be directly utilized for the creation of new private sector services and the strengthening of industrial competitiveness.
In the new industries sector, the Korea Energy Research Institute's 'Renewable Energy Technology Potential Data' will be provided. The power generation potential of seven types of renewable energy—solar, wind, hydroelectric, ocean, biomass, waste, and geothermal—is disclosed by latitude, longitude, and administrative district to support business feasibility analysis and investment decisions by private companies.
In the K-Culture sector, the Korea Culture Information Service's "AI Training Data for the Culture Sector" is being made available. This includes 3D modeling data and 2D images of Dancheong patterns in traditional architecture, as well as the era codes, symbolic meanings, and explanatory materials regarding artifacts. By providing historically verified data, it is expected to reduce instances where generative AI distorts our culture and contribute to the revitalization of the game, tourism, and cultural content industries.
In the disaster and safety sector, the National Institute of Construction Safety's "Special Bridge Safety Inspection and Management Data" is being released.
It provides damage images of suspension and cable-stayed bridges, damage types, causes, and repair plans, along with vehicle traffic detection information, to support the early detection of abnormal signs and improve maintenance efficiency.
Data from the Fair Trade Commission and the Rural Development Administration has been included in the AI training sector. The 'Korea Fair Trade Commission Resolution AI Training Data' is structured material designed to enable AI to learn from the Commission's resolutions regarding cases of violations of the Fair Trade Act. By systematically organizing resolution summaries, factual details, judgments, and relevant laws, it is expected to be utilized in developing services for corporate contract review or business risk analysis.
It is anticipated that this will enable the development of services that allow the general public and small business owners to more easily verify whether complex unfair trade practices have occurred.
The Rural Development Administration's 'Crop Pest and Disease Diagnosis Data' provides a combination of disease symptoms, images of adult and larval pests, and detailed descriptive materials. It is anticipated that the development of AI diagnostic services utilizing this data will help increase farm productivity by detecting pests early and reduce the misuse of pesticides through timely control measures.
◆ Expanded Use of Synthetic Data… Simultaneously Securing Personal Information Protection and Industrial Applicability
The Ministry of the Interior and Safety is actively utilizing synthetic data technology to protect personal information during this data opening process. Data containing personal information, such as telephone counseling data in the family and youth sectors and qualification management data for transportation workers, will be processed and provided in the form of synthetic data that reflects the structure and distribution characteristics of the original data.
Through this, the plan is to support companies and research institutions in safely utilizing data while minimizing concerns about personal information infringement.
Previously, the Ministry of the Interior and Safety has supported the creation of various private services in the accommodation, transportation, and legal sectors by opening up data on building fire response facilities, synthetic data on transportation card usage history, and legal interpretations and rulings on special administrative appeals by central administrative agencies.
In particular, the provision of transportation card usage history as synthetic data and the structuring of legal inquiry-and-response cases to enable AI learning are recognized as representative achievements of public data openness.
Minister of the Interior and Safety Yoon Ho-joong stated, "We will actively support corporate growth by rapidly opening up data needed by AI companies," adding, "We will support the leap to becoming one of the top three global AI powerhouses by continuously expanding training data through additional demand surveys and transitioning to an AI-friendly public data management system."
penfree1@hanmail.net