저는 모델3(770만원짜리 완전자율주행옵션을 먹인..) 차주입니다. 그리고 개발자로 근무하고 있습니다.
제가 근무하는 분야는 머신러닝이라던가 AI, 자율주행과는 관련이 멀어서 학문적인 백그라운드는 없지만..^^
옆 팀에서는 머신러닝을 '도구'로 여러가지 일들을 하고 있어서 어떻게 쓰이는지에 대해서는 일반인들보다는 쪼오오끔 이해를 더 하고있습니다. 물론 이 클리앙, 굴당에는 저보다 더 많이 아시는분들도 있을거라 글을 쓰기가 부끄럽지만, 아래 스마트서먼의 기능과 출시에 대해서 적어보고자 합니다.
테슬라 이야기를 하기 앞서서, 자율주행 분야에 있어 테슬라를 설명하자면 머신러닝, 딥러닝분야가 어떻게 '도구'로 쓰이는지를 이해하는것이 좋습니다.
머신러닝(과 딥러닝)은
1. '학습데이터'를 준비해서
2. '학습데이터'를 가지고 '특정한 방법'으로 학습을 시킨 뒤,
3. '특정한 방법'을 가지고 '학습데이터'와 '실제데이터'를 다시 처리하게 해서
4. 그 결과를 정량적으로 평가
그 뒤 2~4를 반복하여 가장 뛰어난 '특정한 방법'을 찾아가는 방식입니다. (비전공자나 관련지식이 아예 없는 분들을 위한 간략한 소개입니다.)
'특정한 방법'에 대한 세부수치와 학습방식등을 바꾸어 가면서 가장 최적화된 '특정한 방법'과 세부 수치들을 찾아가는 방식인데, 그런데 문제는..... 이게 왜 어째서 되는지 그 결과에 대한 원인을 추측할수는 있지만, 명쾌하게 설명할 수는 없는 단계입니다.
학문적으로는 이에 대한 원인을 명쾌하게 설명하고 싶어서 열심히 연구중일텐데, 사실 현업에서는 그게 중요한게 아니고 '도구'로써 잘 동작하면 그만인지라 '특정한 방법'들이 논문을 통해 학문적으로 소개가 되면 그거 따라해보면서 아 이게 더 좋은가? 열심히 돌려보면서 가장 최적의 '특정한 방법'을 찾아내서 제품으로 나오고 있는거죠.
위 1~4번 부터의 단계 중 가장 중요한 단계가 무엇이라고 느껴지시나요? 학습을 잘 해야하니까 2번? 평가를 잘못하면 안되니 4번일까요? 최근에 재미있는 기사가 하나 있었는데..
https://biz.chosun.com/site/data/html_dir/2019/12/19/2019121900144.html
이 기사를 읽고오시면 아마 1번이라고 느끼실겁니다.
실제로 현장에서도 '잘 정제되고 잘 분류된 학습데이터'를 만들어 내는 것이 그동안 머신러닝좀 해보니까 젤 중요하더라..로 귀결되고 있습니다.
그럼 자율주행이라는 분야에 있어서, '학습데이터'는 어떻게 만들어질까요? 구글의 웨이모, GM의 크루즈 모두 실제 테스트 차량을 도로에 던져서 데이터를 얻고 있습니다.
돌발상황 없이 흐름이 원활할때의 주행은 대부분 잘 달리게 됩니다. 그래서 돌발상황이 비교적 적은 고속화도로에서의 자율주행은 다른 차량을 인지해서 간격을 벌리고, 차선만 잘 따라가는 정도이니까요. 그런데 문제는... 시내와 같이 판단할 거리가 많은 도로라던가, 차선이 복잡하게 바뀌는 고속화도로의 합류지점과 같은 곳, 그리고 옆 차로에 있던 앞 차가 갑자기 끼어들려고 차선을 물기 시작하는 바로 그 시점과 같은 케이스는 일일히 좋은 학습데이터를 만들기가 쉽지 않습니다.
테슬라는 어떻게 학습데이터를 만들고 있을까요?
테슬라는 완전자율주행옵션을 선택하지 않아도, 기본적인 TACC(앞차와 거리를 조절하는 크루즈컨트롤)가 지원됩니다.
테슬라는 완전자율주행옵션을 선택하지 않아도, 자율주행에 필요한 모든 하드웨어가 장착되어 있습니다.
그리고, 테슬라가 공식적으로 shadow mode가 존재하는 것을 발표하기도 했죠.
https://www.forbes.com/sites/bradtempleton/2019/04/29/teslas-shadow-testing-offers-a-useful-advantage-on-the-biggest-problem-in-robocars/#1d447f3e3c06
제 개인적으로는 완전자율주행옵션을 무조건 넣어야겠다- 라고 생각한 계기이기도 합니다.
자동차가 커넥티드카라서 단순히 OTA로 업데이트를 '받는 것'이외에도, 사용자의 주행로그를 수집해서 테슬라로 '주고' 있는건데요.
이게 모든 로그를 수집하는 방식으로는 동작하는것이 아닙니다.(음..아닐겁니다.)
shadow mode로 동작하고 있다가,
- 실제 주행과 비교해서 shadow mode의 주행예측이 현저한 차이가 나타나는 경우만 전송을 한다던가
- 운전자가 TACC를 켜고 가다가 차에게 주도권을 빼앗아 주행예측과 차이가 나는 주행을 하는 경우
- 급정거를 한다던가..
이런 경우에만(뭔가 수집할만한 가치가 있는 상황에서만) 전송을 하고 있는 것이겠죠.
'학습데이터'가 가장 중요하다고 했는데, 쌓이는 데이터의 볼륨자체가 다를 수 밖에 없습니다.
스마트서먼이 갑자기 뜬금없이 국내에도 업데이트가 되었는데요.
스마트서먼도 자율주행, 특히 도로가 아닌 매우 혼잡하고 엣지케이스가 많은 상황에서의 자율주행을 발전시키는데에 많은 도움을 줄겁니다. (공도에서는 사용 불가)
스마트서먼을 활용해서 끝까지 성공적으로 위치에 도착했다: 성공케이스에 대한 학습데이터
스마트서먼 사용중 일시정지 시킨것: 뭔가 맘에들지 않았거나, 위험했거나, 엉뚱한곳으로 간 것에 대한 학습데이터
물론 이러한 테슬라의 수집정책(?)을 못마땅해 하시는분도 계시겠지요.
그래도 저는 이게 지금 상태의 최선이라고 생각합니다.
정말 최선의 방법은 스마트서먼 기능에 대한 베타테스터를 따로 모집하고
해당기능 사용중 손해가 발생시 테슬라가 책임지지 않는다는 동의서에 동의한 사람의 차에만 해당 기능을 ON 하도록 해야죠.
지금 그런게 있나요? 딱히 들어본적이 없는데 말이죠...
테슬라의 현재 기능 중 불완전한 기능이 많은데 그 한계를 정확히 알면 상당히 유용하고 편하게 잘 활용할 수 있다고 생각합니다 .. 만.. 불안한 분들은 타 회사가 완벽하게 만들기를 기다렸다 경험하시면 되겠죠.
대단하다고 생각합니다
근데 이 머신러닝이라는 분야가.. 어쩔 수 없습니다. 어떻게 돌아가는지도 모르는데 100%로 보장할 수 있는 기업은 없으니까요. 운전기사도 안전 100%를 보장을 못 하는데요...
위에 댓글로 잘 남겨주셨지만 베타기능 맞습니다.
그리고 이걸 개런티하는 정식 기능을 출시하고 싶어도 못합니다.
얼마전에 기사 나왔죠. 전 세계 최초로 우리나라에서 (자율주행 3레벨 차량의 특성 및 최소조건을 기반으로) '자율주행 차량 출시에 대한 법률적 근거'를 만들었다구요.
타 차량 위치 추정도 정확하지 않고. 라바콘은 흰/주황색 반복 패턴이면 여지없이 오검출 하고요.
우적감지 와이퍼도 설명에는 근사하게 백만장 이미지로 학습했다고 하지만 막상 써보면 한대 때리고 싶고요.
저는 테슬라 타면서 데이터 수집량 대비 제일 활용 못하는 업체가 테슬라 아닌가 싶은 생각을 하게됐습니다
현대 모비스 등이랑 일하는 스트라드비전(국내업체) 결과만 봐도 테슬라나 큰 차이가 없어요.
몇만대 깔려있는 차에서 데이타 얻어봐야.. 웨이모 차 백대 내외에서 올라오는 것보다 성능이 더 안좋아요
제가 웨이모가 디벨롭하는 기술이 탑재된 차를 당장 살 수 없으니, 코나ev나 니로ev대신 모델3을 선택한거니까요 뭐.
같은 기준으로 현기차나 자기가 싫어하는 브랜드가 그렇게 했어도 칭송할 것인지 돌려 생각해보면 대충 답이 나오죠.
차는 안되고 소프트웨어만 그 기능이 가능해야하는 이유를 납득이 가게 설명해 주신다면 공감이 될 것 같습니다.
그리고, 현존하는 주차기능들중에 운전자의 책임이 없는 주차기능이 출시된게 있다면 알려주세요.
위험 부담은 사회와 국가에 떠넘기는 나몰랑
행태라고 봅니다
결국 울 나라는 저걸 뒷받침하는 방향으로 움직이겠죠
테슬라에게 우리나라 좋은 테스트베드 될거라고 봅니다