테슬라 스마트서먼은 왜이렇게 멍청한걸 업데이트 했을까(with 머신러닝) : 클리앙

저는 모델3(770만원짜리 완전자율주행옵션을 먹인..) 차주입니다. 그리고 개발자로 근무하고 있습니다.

제가 근무하는 분야는 머신러닝이라던가 AI, 자율주행과는 관련이 멀어서 학문적인 백그라운드는 없지만..^^

옆 팀에서는 머신러닝을 '도구'로 여러가지 일들을 하고 있어서 어떻게 쓰이는지에 대해서는 일반인들보다는 쪼오오끔 이해를 더 하고있습니다. 물론 이 클리앙, 굴당에는 저보다 더 많이 아시는분들도 있을거라 글을 쓰기가 부끄럽지만, 아래 스마트서먼의 기능과 출시에 대해서 적어보고자 합니다.

테슬라 이야기를 하기 앞서서, 자율주행 분야에 있어 테슬라를 설명하자면 머신러닝, 딥러닝분야가 어떻게 '도구'로 쓰이는지를 이해하는것이 좋습니다.

머신러닝(과 딥러닝)은

1. '학습데이터'를 준비해서

2. '학습데이터'를 가지고 '특정한 방법'으로 학습을 시킨 뒤,

3. '특정한 방법'을 가지고 '학습데이터'와 '실제데이터'를 다시 처리하게 해서

4. 그 결과를 정량적으로 평가

그 뒤 2~4를 반복하여 가장 뛰어난 '특정한 방법'을 찾아가는 방식입니다. (비전공자나 관련지식이 아예 없는 분들을 위한 간략한 소개입니다.)

'특정한 방법'에 대한 세부수치와 학습방식등을 바꾸어 가면서 가장 최적화된 '특정한 방법'과 세부 수치들을 찾아가는 방식인데, 그런데 문제는..... 이게 왜 어째서 되는지 그 결과에 대한 원인을 추측할수는 있지만, 명쾌하게 설명할 수는 없는 단계입니다.

학문적으로는 이에 대한 원인을 명쾌하게 설명하고 싶어서 열심히 연구중일텐데, 사실 현업에서는 그게 중요한게 아니고 '도구'로써 잘 동작하면 그만인지라 '특정한 방법'들이 논문을 통해 학문적으로 소개가 되면 그거 따라해보면서 아 이게 더 좋은가? 열심히 돌려보면서 가장 최적의 '특정한 방법'을 찾아내서 제품으로 나오고 있는거죠.

위 1~4번 부터의 단계 중 가장 중요한 단계가 무엇이라고 느껴지시나요? 학습을 잘 해야하니까 2번? 평가를 잘못하면 안되니 4번일까요? 최근에 재미있는 기사가 하나 있었는데..

https://biz.chosun.com/site/data/html_dir/2019/12/19/2019121900144.html

이 기사를 읽고오시면 아마 1번이라고 느끼실겁니다.

실제로 현장에서도 '잘 정제되고 잘 분류된 학습데이터'를 만들어 내는 것이 그동안 머신러닝좀 해보니까 젤 중요하더라..로 귀결되고 있습니다.

그럼 자율주행이라는 분야에 있어서, '학습데이터'는 어떻게 만들어질까요? 구글의 웨이모, GM의 크루즈 모두 실제 테스트 차량을 도로에 던져서 데이터를 얻고 있습니다.

돌발상황 없이 흐름이 원활할때의 주행은 대부분 잘 달리게 됩니다. 그래서 돌발상황이 비교적 적은 고속화도로에서의 자율주행은 다른 차량을 인지해서 간격을 벌리고, 차선만 잘 따라가는 정도이니까요. 그런데 문제는... 시내와 같이 판단할 거리가 많은 도로라던가, 차선이 복잡하게 바뀌는 고속화도로의 합류지점과 같은 곳, 그리고 옆 차로에 있던 앞 차가 갑자기 끼어들려고 차선을 물기 시작하는 바로 그 시점과 같은 케이스는 일일히 좋은 학습데이터를 만들기가 쉽지 않습니다.

테슬라는 어떻게 학습데이터를 만들고 있을까요?

테슬라는 완전자율주행옵션을 선택하지 않아도, 기본적인 TACC(앞차와 거리를 조절하는 크루즈컨트롤)가 지원됩니다.

테슬라는 완전자율주행옵션을 선택하지 않아도, 자율주행에 필요한 모든 하드웨어가 장착되어 있습니다.

그리고, 테슬라가 공식적으로 shadow mode가 존재하는 것을 발표하기도 했죠.

https://www.forbes.com/sites/bradtempleton/2019/04/29/teslas-shadow-testing-offers-a-useful-advantage-on-the-biggest-problem-in-robocars/#1d447f3e3c06

제 개인적으로는 완전자율주행옵션을 무조건 넣어야겠다- 라고 생각한 계기이기도 합니다.

자동차가 커넥티드카라서 단순히 OTA로 업데이트를 '받는 것'이외에도, 사용자의 주행로그를 수집해서 테슬라로 '주고' 있는건데요.

이게 모든 로그를 수집하는 방식으로는 동작하는것이 아닙니다.(음..아닐겁니다.)

shadow mode로 동작하고 있다가,

- 실제 주행과 비교해서 shadow mode의 주행예측이 현저한 차이가 나타나는 경우만 전송을 한다던가

- 운전자가 TACC를 켜고 가다가 차에게 주도권을 빼앗아 주행예측과 차이가 나는 주행을 하는 경우

- 급정거를 한다던가..

이런 경우에만(뭔가 수집할만한 가치가 있는 상황에서만) 전송을 하고 있는 것이겠죠.

'학습데이터'가 가장 중요하다고 했는데, 쌓이는 데이터의 볼륨자체가 다를 수 밖에 없습니다.

스마트서먼이 갑자기 뜬금없이 국내에도 업데이트가 되었는데요.

스마트서먼도 자율주행, 특히 도로가 아닌 매우 혼잡하고 엣지케이스가 많은 상황에서의 자율주행을 발전시키는데에 많은 도움을 줄겁니다. (공도에서는 사용 불가)

스마트서먼을 활용해서 끝까지 성공적으로 위치에 도착했다: 성공케이스에 대한 학습데이터

스마트서먼 사용중 일시정지 시킨것: 뭔가 맘에들지 않았거나, 위험했거나, 엉뚱한곳으로 간 것에 대한 학습데이터

물론 이러한 테슬라의 수집정책(?)을 못마땅해 하시는분도 계시겠지요.

그래도 저는 이게 지금 상태의 최선이라고 생각합니다.

굴러간당

이야기 테슬라 스마트서먼은 왜이렇게 멍청한걸 업데이트 했을까(with 머신러닝) 21