사람이 OO을 주문해달라고 말한다 -> (AI는) 스피치 투 텍스트 변환 -> (AI가) 딥러닝 기반 맥락파악공식 작동 -> (AI가) 요청수행에 적합한 앱을 킨다 -> (AI가) 화면을 OCR판독하여 최우선 수행할 키워드에 적합한 글자 위치를 찾고 누른다 -> (AI가) 장면마다 OCR, 수행 반복 -> (AI는) 최종화면에서 텍스트 투 스피치로 말을 해준다던지, 결제 진행여부 묻는것을 끝으로 **사람이 OO을 주문해달라고 말한다**로직 마무리
설마 이런걸 기술 발전이라고 생각하진 않으실테고요.
여기서 더 간소화되고 고도화될 부분들이 앞으로 계속해서 적용될겁니다..
그동안의 가중치 블랙박스 문제와 질문범위 벗어날 RAG같은 구조, 통제에 쓰이는 MCP 등의 변화도 이뤄지고 있거덩요.
따라서 AI를 직접 만드시는분들 입장에선 아직 완성은 커녕 기술개발중이라는 이야기가 나오는겁니당.
그리고 우리가 이 AI를 자주 써달라는 이유는, ‘사람이 실제 어떤 로직들을 필요로하는가?’ 정도를 데이터 거의 모두 습득하고나면 이걸 학습시켜서 임베딩하여 온디바이스에 탑재시키면, 속도도 빠를테죠. 그걸 구하는 상황이라고 보면 됩니다.
앞으로 비싸보이는 다양한 신형 웨어러블 도구들이 나올텐데, 마냥 비싸다고 할 문제가 아니라 써보는 사람 입장에서 어떤 도움들을 줬는지 데이터를 많이 확보해야 기업이든, 나라든, 국민 개인이든 비용(돈 외에도 에너지, 시간 등)절약에 도움이 될 것입니다.
앱이 필요없어진다고 누차 한 5개월째 이야기하능것 같네요
보안은 로직을 지키는데에 써야겠고요.
회원정보와 같은 정보수집 대신 실제 모습, 실제 이름 등의 공개될 수 있는걸로 신분을 대체하면 될테죠.
새로운 뉴럴칩도 나올거고, 그게 들어간 제품을 봐야 그때부터는 전력소모 최적화에 총력기울일 시간일테고요.
개인적으로 저 로직에서도 거슬리는 부분은 임베딩된 벡터 하나하나에는 벡터니깐 방향성이 부여된 상태인데, 다양한 방향을 동시에 추론해낼 식이 나타날지 아닐지 아니면 내가 아직 파악 못한 논문이 있는지 너무 머리아픕니당.
+++
로직을 보호하자는 말은 레시피를 보호하자는 말입니당.
제가 생각하는 미래에는 아무개가 고대음식인 bb* 황올치킨을 필요로한다고 가정했을때, 공개된 레시피가 있다면 집근처 요리해주는 공무원 로봇이 고대음식 bb*치킨을 직접 조리하여 가져다 주겠고, 레시피가 잘 지켜졌다면 bb*라는 업체에 주문 넣고 물건받아오는 로직으로 수행하겠죠.