HW4.1에 대해 테슬라가 공식 콜에서 언급은 했습니다.
2026년 4월 Q1 실적 콜에서 머스크가 AI4.1 또는 AI4+를 언급했고, 기존 AI4 대비 메모리/메모리 대역폭/연산 성능을 일부 올린 버전으로 설명했습니다. 야후 파이낸스에 올라온 콜 트랜스크립트에도 “AI4.1 or AI4+” 및 약 10% 컴퓨트 증가, 메모리 대역폭 증가 취지의 발언이 정리되어 있습니다.
메모리가 16GB -> 32GB로 증가한다고 했답니다.

로컬 LLM을 만져보면 대충 알게 되는데, 비슷한 종류의 AI가 작동할때 메모리 대역폭하고 메모리 용량은 생각보다 큰 차이를 만들어냅니다. FSD는 LLM은 아닐지라도 마찬가지 영향을 받게 되죠.
FSD는 큰 틀에서는 “LLM 계열 사고방식으로 진화한 AI”라고 봐도 꽤 맞습니다.
다만 엄밀히 말하면 FSD는 LLM은 아니고, VLM/월드모델/행동모델에 가까운 자율주행용 foundation model 쪽입니다.
이런 모델이 작동할때 메모리 대역폭하고 메모리 용량은 세대를 달리한다고 봐도 좋을만큼 차이를 만들어내는데,
3060Ti 8G vs 4060 8G -> 3060Ti 8G가 더 좋음. 대역폭 때문에
3080Ti 12G vs 5070Ti 16G -> 대역폭은 3080Ti가 2세대 전이지만 딸리지 않아 성능 여전히 좋음. 하지만 4G 차이가 큼.
이것들은 단지 AP가 좋아져서가 아니고 메모리 용량과 대역폭 때문에 큰 차이가 나게 됩니다.
더 좋은 모델을 돌릴 수 있느냐 아니냐의 차이가 생기고, 대역폭 때문에 성능의 차이가 생기죠.
'FSD 같은 실시간 비전 AI에서는 더 그렇습니다. 카메라 여러 대의 연속 프레임, feature map, occupancy, planner, temporal context를 계속 붙잡고 있어야 하니까요. 메모리 용량이 부족하면 모델을 줄이거나, context를 줄이거나, 중간 표현을 압축해야 합니다. 대역폭이 부족하면 연산 유닛이 놀고, latency가 튀고, 프레임 처리 여유가 줄어듭니다.
그래서 HW4 → HW4.1이 메모리 양과 대역폭을 의미 있게 올린다면, 소비자 입장에서는 사실상:
같은 HW4 계열이지만, FSD 모델 수용 한계가 다른 차
라고 봐야 합니다.
테슬라는 마케팅상 “AI4 개선판”, “생산 리비전”, “효율 개선” 정도로 말할 수 있지만, 기술적으로는 동일 세대 내 마이너 수정이라기보다 준세대교체에 가깝습니다.' 라고 해설합니다. (GPT가)
HW5보다 HW4.1은 생각보다 빨리 슬쩍 바꿔서 들어올 가능성이 있어보이는데, 이쪽 움직임을 주시하면 좋을것 같습니다.
'AI5 자체는 차량용 로드맵에서 완전히 빠진 게 아니라, 초기에는 Optimus, AI 슈퍼컴퓨터/데이터센터, 개발용 또는 특수 차량 쪽이 우선이고, 일반 소비자 차량 대량 탑재는 빠르면 2027년 이후 쪽으로 보는 분위기입니다. Not a Tesla App은 최근 정리에서 일반 소비자 차량의 AI5 적용은 삼성/TSMC 양산 이후인 2027년으로 예상했고, Cybercab도 초기 생산은 AI4 기반으로 간다고 정리했습니다.'
ai4.1이라도 생각보다 변화가 커보입니다.
Elon Musk
Well, the reason AI5 tape-out finished early was because the team worked incredibly hard to make it happen. Just over time, we gathered a lot of momentum. We did have to work every weekend for six months straight, including every holiday. It was a lot of sacrifice by the team and I was there, of course, myself, every weekend. Fortunately, we didn't make any major mistakes, at least that we're aware of, that required pushing out the tape-out. The team just did a great job and worked incredibly hard is the reason. I do expect that AI5 will go into Optimus and into the data center, because it's looking like we'll be able to achieve unsupervised self-driving with AI4 that is far greater than human safety levels. Which means it's certainly not immediately needed in the car.
Elon Musk
At some point, I think it will make sense for us to switch to AI5 in the car, but there's not a pressing issue to do so. At some point the AI4 hardware is going to get so old that it's like, okay, the only reason they're keeping the factory open is for AI4. We are planning an AI4 upgrade to use a newer generation RAM. It'll go from 16 gigabytes to, I think, 32 gigabytes per SoC, so a total of 64 gigabytes. Probably a 10% increase in compute in trillions of operations per second and in memory bandwidth. That's AI4.1 or AI4+ probably goes into production middle of next year, I think. Samsung's doing the modifications for us, so it sort of depends on when they're able to finish those modifications and bring it to production.
아래는 현재 차량을 AI5로 바꾸는 것은 급한일이 아니고 AI4는 나중에 한참 오래되도 성능은 괜찮겠지만,
그쯤되면 칩공장들이 낡은 AI4를 위해서만 공정을 유지하는 상황이 될것이고, 그래서 AI4 업그레이드에는 신공정 메모리를 사용할거다.
SoC당 16g에서 32g가 될거고 메모리밴드위스가 10% 정도 높아질거다. AI4.1이나 AI4+로 부르게되든 내년쯤 생산에 들어가고 아마도 삼성이 midification을 할거라 삼성의 작업이 언제 끝나느냐에 생산시작이 달라진다.
양산코스트와 라인 유지를 위한 공정업이 더 주효한 이유처럼 얘기하고 있군요.
기본적으로 요즘 openclaw 등을 위해 로컬 llm을 설정해서 돌려보신분들을 알겠지만 메모리가 상당히 중요합니다 (해서 메모리가 큰 맥미니가 갑자기 많이 팔렸었죠. 똑같은 M4칩이라도 메모리가 크면 훨씬 좋은 llm모델을 돌릴수가 있죠)
보통 학습용도 그렇지만.. 추론용의 경우도 메모리에 병목이 심하기 때문에 메모리가 커지면 ai성능향상에 큰 도움이 되죠
이건 안올거라고 봐야겠죠?
메모리 수급이슈로 가격인상 혹은 생산지연이 꽤 심한듯 하더군요
모든 판단이나 결과물이 필요한 추론이나 학습 등은 HW 구성에서는 칩셋 성능을 제외하고 보면 용량 보다 대역폭이 중요합니다. 대역폭이 속도에 크게 관여하고 용량이 크다면 여유가 더 있는것이지 실질적인 성능 향상폭은 크지 않습니다.
만약 메모리 용량을 올렸는데 결과물이 기존보다는 의미 있는 수준으로 됐다고 가정하면 그건 기존 하드웨어가 메모리 용량에 부족했다는 뜻이죠.
모델의 급 차이가 어떤 의미를 가지는지는 LLM을 로컬로 돌려본 분들은 잘 알고 계실것이구요.
게임할때야 그래픽카드의 코어가 큰 역할을 하지만 AI를 해보려고 LLM을 올려보면 메모리 크기 차이가 확 다가옵니다.
실질적인 성능 향상 폭은 크지 않더라도 추론의 깊이가 달라질수 있는 변화입니다.
칩의 성능이 공정율 향상 정도의 성능차이와 대역폭도 그 수준이라면 대량의 외부 데이터가 들어오고 빠른 추론이 필요할때는 사용자가 크게 느낄수 없죠. 다만 그 경계 어디선가에서 갈릴때는 느낄수 있죠. 용량이 커져서 느낄수 있는건 빠른 추론이 필요할때 빼고 메모리 압박이 들어오는 상황 일부분일겁니다. 이건 게임이 아니거든요.
메모리 용량이 2배로 올랐다면 칩셋도 대역폭도 적어도 30% 올라야 전체적인 큰 성능업의 의미가 있다는것이지요.