서울대 빅데이터 AI 센터는 지난 30년간 삼성전자, 현대자동차, 포스코, SK하이닉스, 두산, 대우조선해양, SK텔레콤, 엘지전자, 삼성카드, CJ제일제당과 같은 기업들과 빅데이터 AI을 통한 인사이트 및 포사이트를 도출하는 연구개발 및 핵심 인력에 대한 빅데이터 AI 교육에 관련된 일을 하여 왔습니다.
본 연구진이 수행하는 연구개발 활동의 핵심은 기업의 특정 해당 부서나 전사에 존재하는 데이터를 수집하고 청소하고 분석하여 기존의 의사결정에서 간과되었던 사실 기반의 객관적 지식을 도출하는 것입니다. 이에 대한 결과는 여러 가지 형태로 제공됩니다. 먼저, 제공된 데이터의 양과 질은 어떠한지, 이 데이터를 어떻게 수집, 청소했는지, 도출된 지식은 무엇이며, 이를 의사결정에 어떻게 적용할 수 있는지를 보고서 형태로 제공합니다. 이외에도 개발된 모델을 향후 업무에서 사용하도록 시스템 구현을 추진하는 경우, 본 연구센터에서는 직접 시스템을 개발하지는 않으므로 다른 업체가 개발할 수 있도록 핵심 알고리즘과 소스 코드를 제공합니다. 다만, 최근에는 시각화 도구를 활용하여 시스템 구축 없이 데이터를 직접 보고 의사결정 할 수 있는 환경을 구축하여 제공하기도 합니다. 연구개발 후에는 해당 업체와 서울대 산학협력단 공동 명의로 국내외 특허도 출원하며, 국내외의 저널이나 학술대회에 논문 발표하기도 합니다.
모든 빅데이터 AI 프로젝트는 본 센터 담당 연구원들과 기밀유지협약서(Non-disclosure agreement)를 체결합니다. 또한, 프로젝트 종료 후, 외부에 발표하는 모든 내용은 사전 검토를 받아, 해당 기업의 영업 비밀이 철저히 보호되도록 합니다. 데이터를 센터로 보내는 방법은 크게 두 가지가 있습니다. 계약이 체결된 후에, 데이터를 공식적인 보안 절차를 밟은 후에 본 센터로 이메일이나 ftp로 전송합니다. 또한, 아예 자체적으로 서버를 준비해서 거기에 보안 소프트웨어를 설치한 후, 데이터를 담아 센터에 갖다 놓고 프로젝트가 종료되면 다시 가지고 갑니다. 이 두 가지 경우 모두, 온도와 같은 중요한 변수 명은 XYZ 와 같이 알아볼 수 없도록 코딩하기도 하고, 실제 데이터 값 100도나 110도를 어떤 값으로 빼고 나누어서 0.8과 0.88로 변환하기도 합니다. 즉, “변수 XYZ 의 값이 0.8” 이라는 것이 설사 외부에 실수로 누출된다 해도 이것이 온도 100도 라고 유추하는 것이 전혀 불가능하게 만드는 것입니다. 중요한 것은 본 센터에서 과거 20년간 산학 협동 연구개발을 수행하여 온 동안 데이터나 노하우 유출과 관련된 불미스러운 사건이 한 건도 발생하지 않았습니다. 이는 모든 산학 협동 프로젝트에서 위의 절차를 밟아왔고, 연구원들의 전문가 정신이 투철하기 때문입니다.
본 센터 연구진의 강점은 다음과 같습니다. 첫째, 지난 30여년간 제조, 통신, 유통, 금융 등의 산업 분야를 대상으로, 제품서비스기획, 생산, 마케팅, 영업, 인사, 보안 등의 경영 분야에서 빅데이터 AI 연구개발을 수행하였습니다. 인더스트리 섹터, 경영 분야, 데이터 종류, 모든 면에서 다양한 경험을 가지고 있습니다. 둘째, 숫자로 된 전통적인 데이터 뿐만 아니라 텍스트와 이미지 데이터에 대한 전문성도 갖추고 있습니다. 특히, 텍스트 데이터는 빅데이터의 가장 큰 특징으로서 기업이 보유한 데이터의 대부분을 차지하고 있음에도 불구하고, 사내 분석 능력이 없고, 이에 대한 인식이 낮아 전혀 활용되지 못하고 있습니다. 또한, 소셜미디어에 표출되는 소비자의 제품에 대한 반응이나 자신들도 모르는 바램을 분석하여, 이에 대한 신속한 대응과 신제품 기획에 중요한 키 파인딩으로 (key findings)로 사용할 수 있습니다. 셋째, 본 센터의 연구진의 강점은 산학 협동에 있어서의 철학입니다. 일반적으로 많은 연구 센터들이 자신들이 개발한 방법론에 포커스를 두고, 실제 비즈니스 문제는 해당 방법론의 우수성을 증명하기 위한 수단으로 보는 경향이 있습니다. 그러나, 본 센터는 자체 개발 방법론에 포커스를 두는 것이 아니라, 실제 기업이 가지고 있는 비즈니스 문제에 포커스를 둡니다. 즉, 본 연구소가 가지고 있는 산학협동 철학은 비즈니스 문제의 해결에 있지, 자체 개발 방법론의 우수성 증명이 아닙니다. 따라서, 본 센터에서는 문제를 해결하는데 있어, 자체적으로 개발한 방법론 뿐만 아니라 기존에 다른 곳에서 개발된 방법론도 함께 적용하여, 가장 바람직한 솔루션을 도출한 후, 이를 제안합니다.
초기에 데이터를 추출하기 위해 몇 차례 방문하기는 하지만 상주하지는 않습니다. 연구원의 대다수가 현재 박사과정을 밟고 있는 학생들이기 때문에 프로젝트에 전업으로 참여하지 않기 때문입니다.
취업 결정은 전적으로 연구원 개인의 판단에 의해서 이루어집니다. 그러나 자신이 실제로 경험했던 인더스트리, 해당 기업, 해당 경영 문제에 대해 이해도가 넓어지고, 관심이 많이 생기는 것이 사실입니다. 따라서 많은 연구원들이 해당 분야, 해당 기업으로 취업하는 경향이 확실히 있습니다.
자문이나 교육도 주요 산학협동의 일부입니다. 그 동안, 삼성전자, 포스코, CJ제일제당, 삼성SDS, SK하이닉스, 롯데와 같은 기업의 의사결정자 (decision maker)들을 대상으로 빅데이터 AI 교육을 하였습니다. 의사결정자 들이란 기업의 경우, 상품기획, 연구개발, 공정관리, 마케팅 및 영업, 인사 등의 업무를, 공공기관의 경우 정책 입안 업무를 하는 조직의 가장 중추적인 인력들입니다. 이들에게 데이터를 분석한다는 것은 무슨 뜻인지, 실제 데이터분석을 소프트웨어로 하는 것은 어떤 것인지, 데이터를 분석하면 어떠한 결과가 나오는지, 구체적인 성공 사례는 어떤 것이 있는지, 각자의 평소 업무 가운데 데이터 분석을 할 만한 것은 무엇인지, 그리고 실제로 관련 데이터를 이용하여 분석하면 어떤 결과가 나오는지를 체득할 수 있도록 교육합니다. 네 가지 과정으로 이루어진 교육 프로그램은 빅데이터 AI 이론 학습, 빅데이터 AI 프로그래밍 실습, 비즈니스 문제의 빅데이터 AI화 실습, 실제 비즈니스 데이터를 활용한 프로젝트 수행입니다. 교육 기간은 해당 기업이 원하는 구체적인 교육 컨텐츠, 대상, 수준, 예산 등에 따라 전일제 기준으로 3일에서 4주까지 다양합니다.
산학협동에 관심이 있다면 센터 이메일 datamining@snu.ac.kr로 연락 주시기 바랍니다.