-파트리지시스템즈 이준하 대표
-데이터 선별과 압축 기술 특징
AI 시대가 본격화되면서 데이터의 중요성은 말이 필요 없을 정도의 상식이 됐다. 그러나 자율주행과 제조 현장에서 마주하는 현실은 다르다. 데이터 양은 넘쳐나는데 모두 저장하는 데에는 한계가 있고 학습도 불가능하다. 파트리지시스템즈는 ‘얼마나 많이 모을 것인가’가 아니라 ‘무엇을 남길 것인가’에 집중한다. 이준하 대표는 자율주행 데이터 현업에서 쌓은 경험을 바탕으로 데이터 선별과 압축 기술에 해법을 제시한다. 데이터 병목을 해결하지 않으면 자율주행도, 스마트 제조도 다음 단계로 갈 수 없다는 그의 문제의식은 산업 전반에 시사하는 바가 크다.
<사진: 파트리지시스템즈 이준하 대표>
-처음 파트리지시스템즈를 설립하게 된 계기는?
“현업에서 근무를 하다가 답답해서 창업을 했다. 2014년에 학위를 받고 좋은 기회가 있어서 미국에 갔는데 마침 간 곳이 디트로이트였다. 주위를 둘러봤는데 전부 자동차 회사밖에 없었고 자연스럽게 해당 산업군으로 갔다. 참고로 전공은 소프트웨어 공학이다. 맨 처음 간 곳이 마그나였다. 당시에는 데이터 사이즈와 중요성이 그렇게 중요하지는 않았다.
하지만 시간이 흐를수록 데이터에 대한 관심이 높아지면서 저절로 해당 부서도 커졌다. 맨 처음 혼자하던 일이 50명 조직으로 확대됐고 데이터 사이즈도 10배 이상 늘어났다. 하지만 커진 규모에 비해서 하는 일들은 주먹구구식으로 다루고 있었다. 과연 지금의 상황으로 자율주행차를 만들 수 있을까 하는 의문과 함께 내가 잘 할 수 있는 분야이니 해보자라고 확신을 갖고 설립하게 됐다. 2020년 초에 한국으로 돌아와서 본격적으로 사업을 시작했다”
-파트리지시스템즈는 어떤 회사인지?
“데이터를 처리하기 위한 인프라를 제공하는 업체다. 지금의 소프트웨어들은 대체로 인터넷에서 데이터를 학습하고 처리한다. 예를 들어 챗 GPT를 보면 인터넷 상에 미리 나와있는 소스를 취합하고 분석해서 답을 알려준다. 사람이 정제해서 글로 써 놓거나 그림을 그려 놓은 것을 찾아서 답을 주는 방식이다. 하지만 우리는 초점을 맞추고 있는 것은 하드웨어 AI 다. 피지컬 AI라고도 하는데 기본적인 데이터를 가지고 학습을 하지만 인터넷에서 사람이 정제한 데이터가 아니라 물리적인 상황에서 센서 데이터를 기반으로 해결책을 제시하는 방법이다.
하지만 이 과정에서 기존에 없었던 병목이 발생하는데 기존에는 데이터를 많이 모아 놓고 압축시키자 였다면 피지컬 AI는 다 취득하기가 불가능하다. 데이터 사이즈가 기존 소프트웨어에 비해 1000배 이상 크기 때문이다. 그래서 피지컬 AI에서는 어떤 걸 취득하지 않을 것이냐를 판별하는 능력이 중요하다. 우리는 데이터를 취득할 때 어떤 것을 선택하고 거를 것이냐를 선별하는 것에 중점을 두고 있다.
사실 선별을 해도 데이터가 엄청나게 크다. 예를 들면 차 외부에 붙은 카메라가 도로 상황을 인식하기 위해 사진 하나를 찍는데 16메가 사이즈가 나온다. 이런 이미지가 1초에 30프레임씩 들어온다. 단순 계산 만으로도 500메가가 들어온다. 이런 카메라가 차 1대당 10대가 붙는다. 종합하면 1초에 5기가 사이즈의 데이터를 처리해야 한다. 심지어 이런 데이터를 취득하고 나면 90%이상 쓸데없는 내용이다. 그래서 맨 앞단에서 선별하는 역할이 중요하고 우리는 이런 능력에 최적화되어 있다. 또 이러한 데이터를 옮기는 것도 많은 비용이 드는데 우리는 압축 기술을 활용해 컴팩트하게 용량을 줄이는 능력도 갖고 있다.
참고로 지금까지 데이터를 옮기는데 가장 많이 쓰는 방법은 DHL이다. 차에서 하드를 떼어내서 택배로 보낸다. 현업에서 이런 일을 하다 보면 왔다 갔다 하는데 한달 걸리고 심지어 중간에 하드가 깨지기도 하고 유실되기도 한다. 이런 상황을 겪을 때면 내가 언제 자율주행차를 완성하지? 라는 회의감이 든다. 이런 문제를 해결하고자 창업을 했다”
<사진: 파트리지시스템즈 활동 분야>
-정확히 어떤 방식으로 AI 데이터 효율화를 이뤄내는지 궁금하다
“지금 우리가 하고 있는 일은 크게 두 가지가. 첫번째는 AI를 위한 AI를 만들고 있다. 예를 들어 자율주행 1만 시간을 했다고 하면 취득한 데이터에서 필요한 부분을 선별하는 AI를 만들고 있다. 학습이나 검증에 필요한 데이터일지 아니면 버려도 될지 선별하기 위한 AI들이다.
두 번째는 압축이다. 기존에도 압축기들이 있지만 센서 데이터에 최적화 되어있지 않은 공용 압축기 형태다. 우리는 각 센서의 특성을 반영해서 압축 방법을 제공한다. 고효율 압축 솔루션을 만들고 있으며 범용성은 떨어지지만 특정 센서나 이미지 포맷에는 최적화 되어있는 압축 솔루션이라고 생각하면 된다”
-파트리지시스템즈의 대표적인 협업 사례를 소개한다면?
“자율주행과 관련된 자동차 현업에서 근무했다 보니까 해당 분야에 집중돼 있다. 그리고 나와서 보니 자동차에 쓰이던 게 공정에서도 그대로 사용된다는 것을 알았다. 제조 공정도 중요도가 높이 올라가고 있어서 해당 분야에서도 두각을 나타내고 있다.
구체적으로 살펴보면 먼저, 자율주행 시 가장 많은 데이터가 나오는 단계는 ‘검증’이다. 제대로 동작하는 지 검증이 되야 양산을 할 수 있고 인증까지 넘어갈 수 있어서다. 보통 100만km 테스트를 하는데 이 경우 미팅룸 하나가 전부 하드디스크로 채울 만한 데이터가 발생한다. 우리는 AI를 통해서 상황별로 필요한 데이터를 구분하고 각각의 반응을 자동화 하는 솔루션을 제공한다. 원래는 인증을 받기 위해서 사람이 수작업 했던 것을 우리는 자동화시킨 것이다.
두 번째인 공정 분야를 살펴보면 공정 모니터링을 한다. 여기서 진동이나 온도, 습도 등의 데이터들을 현장에서 계속 측정하고 이를 가지고 이상 진동이나 온도, 습도를 종합해서 비상상황인지 정상 상황인지 판단을 제공하고 있다. 만약 이상이 있다고 하면 사내 서버에 올려서 사람이 원인을 분석하게 도와준다. 이 같은 지식 베이스를 만들어서 쌓이게 되면 이상이 발견했을 때 어떻게 해결해야 하는지 즉각적인 제안을 해줄 수 있는 AI를 만들고 있다.
만약 발전을 통해 AI가 해결방안까지 제시해 줄수 있다고 하면 나중에는 피지컬 AI가 해결 방안을 스스로 수행까지 하게 되는 그림을 그리고 있다. 이처럼 자동차와 공정 두가지로 예를 들었지만 핵심은 데이터 파이프라인, AI를 위한 AI, 압축 기술이 기반 되서 운영 중이다”
-타사와 다른 파트리지시스템즈 만의 강점은?
“우리는 데이터를 다루고 있고 AI 시대로 접어든 지금의 상황에서 데이터는 빼 놓을 수 없기 때문에 어떻게 보면 모두가 경쟁자라고 생각한다. 그리고 그 속에서도 우리의 강점은 피지컬 AI에 최적화 되어있는 인재를 갖고 있는 회사라는 것이다. 하드웨어 엔지니어, 데이터 엔지니어, 클라우드 엔지니어, AI 엔지니어 등이 필요하며 우리는 하드웨어부터 높은 수준의 소프트웨어까지 수직계열의 인재를 모두 갖고 있다”
<사진: 기사 내용과 무관>
-마그나와 자율주행 데이터 협업을 들었다. 자세히 소개해 준다면?
“마그나는 글로벌 회사다. 미국에 연구센터가 가장 크게 있고 유럽과 인도에도 있다 한국에도 서플라이어가 있다. 이러한 회사가 글로벌 협업을 하려면 데이터를 옮겨줘야 한다. 그런데 이 데이터가 너무 커서 보낼 수가 없거나 천문학적인 금액이 든다. 우리가 제공하는 솔루션은 압축인데 스트리밍을 통해서 글로벌에서 빠르고 쉽게 접근해서 활용할 수 있는 인프라를 제공하고 있다. 굉장히 효율적으로 자율주행 차를 개발하고 검증할 수 있다.
데이터를 움직이는 데에만 압축이 필요한 게 아니다. 제조업의 경우 보증도 신경 써야 한다. 그때의 문제가 보고됐다고 하면 원인을 파악하고 해결과 방지 등을 위한 관련 데이터를 약 10년 정도 갖고 있어야 한다. 이 때 비용은 적게는 수 십억, 많게는 수 백억에 이른다. 실제로 자동차는 800만 화소 4k인데 제조는 8000만화소다 그래서 데이터 사이즈가 훨씬 크다. 보관비용이 클 수밖에 없는데 우리는 압축 솔루션을 통해 40%, 50%, 80% 가량 줄여 주기 때문에 고객 입장에서는 즉각적인 비용절감 효과를 누릴 수 있다”
-산업용 데이터는 용량이 상당한 걸로 알고 있다. 이를 AI 기술만으로 효율화가 가능한지?
“AI 기술만으로는 안된다. 그만큼 우리가 다양한 인재 풀을 확보하고 있는 이유이기도 하다. 하드웨어 기술은 물론 대용량 데이터를 처리하기 때문에 클라우드나 서버 쪽 기술자들도 필요하다. 이렇게 폭 넓은 분야에서의 기술과 인제가 파트리지시스템즈의 핵심이다”
-AI가 장점만 있을 것 같지는 않다. 해결해야 할 숙제는 무엇이라고 보는지?
“첫번째로는 보안위협이 가장 크다고 생각한다. 자율적으로 움직이다 보니 해킹이 됐을 때 피해가 어마어마할 수 있다. 우리 사회에서 보안이 강조되지 않으면 큰 혼란이 올 수 있다는 것이다. 분명히 해결해야 할 숙제이고 두 번째는 정확성이다.
알고리즘 편향성으로 인해 특정 상황에서는 잘하지만 겪어보지 못하는 상황에서는 오류를 낼 수 있다. 최근에 발생한 사례를 보면 앞에 아무것도 없는데 차가 서 버렸다. 원인은 도로에 검정색 비닐봉지가 날아다녔기 때문이다. 또 빨간 소화전을 아이로 인식해서 차가 멈췄다. 앞으로는 이러한 변수와 상황이 더 많이 생길 수 있다.
기존에 사람이 컨트롤 했을 때는 발생하지 않았던 문제들이 AI를 도입하면서 발생하는 것. 과도기적인 지금의 상황에서 해결해야 할 숙제다. 참고로 AI쪽에서는 모라백의 역설이라고 말한다. 사람한테 쉬운 건 컴퓨터한테 어렵고 컴퓨터한테 쉬운 건 사람한테 어렵다는 것이다. 복잡한 수식 계산은 로봇이 쉬운데 걷고 판단하는 기본적인 행위는 로봇한테는 굉장히 어렵다. 이러한 이유는 경험 때문이라고 생각한다. 사람이 걷기까지 굉장히 오랜 시간이 걸린 것처럼 AI역시 엄청난 시간이 걸릴 것이고 과도기가 올 것이고 문제가 발생하지 않을까 생각한다”
<사진: 기사 내용과 무관>
-미래 제조분야에서 AI는 어떤 식으로 발전할 것이라고 생각하는지?
“제조업이 보수적이다 라는 것은 한국뿐만이 아니고 세계적인 분위기다. 이유는 정확도다. 제조에서는 조금만 틀어져도 큰 손실로 이어지고 자동차는 생명과도 연관돼 있어서다. 하지만 그럼에도 불구하고 생각보다 빠르게 도입될 것이라고 본다. 왜냐하면 더이상 도입하지 않으면 너무 시대에 뒤처지기 때문이다.
실제로 모든 고객사가 TF가 꾸려져 있고 공정에 AI 도입을 추진 중이다. 해당 분야만 전문으로 하는 팀들도 생기면서 가속화될 것으로 본다. 어떤 식으로 발전할지를 본다면 결국에는 다크팩토리로 가지 않을까 생각한다. 사람이 없고 공장 불이 꺼져도 전부 로봇과 자동화로 움직인다는 것이다. 지금은 문제가 생겼을 때 알람을 준다거나 했다면 미래에는 자가치료까지 하면서 또는 디지털트윈 세상에서 검증하고 모든 것을 관리하는 발전을 하게 될 것이다. 또 한가지 상황으로는 저가 중국 제품이 굉장히 빠르게 쫒아오고 있는데 우리도 빨리 뛰어야 하지 않을까 생각한다”
-최근 한국에 테슬라 FSD가 풀렸다. 대한민국 교통 환경에 변화가 있을 것이라고 생각하는지?
“거스를 수 없는 하나의 흐름이라고 본다. 그리고 거부할 수 없다고 본다. 개인적으로 오래된 차를 타고 있는데 이번에 차를 바꾸려고 하는데 마침 FSD가 풀렸다는 소식을 듣고 굉장히 끌렸다. 소비자들의 선택에 달린 문제라고 생각하고 어쩔 수 없이 그런 방향으로 갈 것이라고 생각한다.
과도기적인 문제는 발생할 수 있을 것이다. 자율주행 자체가 워낙 방어운전 형태이고 교통체증도 발생할 수 있을 것 같다. 특히, 우리나라는 매우 극악의 환경을 갖고 있다. 이러한 상황에서 AI가 어떻게 경험할 것이냐가 핵심이고 테슬라 입장에서는 한국데이터가 중요한 자산이 될 것이라고 생각한다.
감독형 FSD 이기는 하지만 워낙 잘 구현되기 때문에 자칫 운전자 주의가 흐트러질 수 있고 사고가 발생할 수도 있다. 그만큼 책임소재의 공방도 혼란이 있지 않을까 생각하고 있다. 하지만 앞서 문제들도 결국에는 빠른 시일내에 규제 안착이라던지 도로의 자율주행에 특화되어 있는 표지판, 신호등이 하나 둘씩 생겨 나면서 적응하지 않을까 생각한다. 테슬라가 촉매제 역할을 했다고 생각한다”
김성환 기자 swkim@autotimes.co.kr