지금 다운로드 받는 중에 이 글을 적습니다.

이런 앱이 왜 여태 없었는지가... 의문이긴 합니다.
# 개발자가 아닌 잘 모르는 사람에게 필요한 접근성.
로컬 모델을 Lmstudio 에 불러와 쓰는 분들 계십니다. 저도 그렇고요.
올라마는 사실 조금 더 빠르고 더 많은 앱에서 지원하기는 하지만,
아직 로컬을 주력으로 쓰는 것이 아니라 그저 취미 비슷하게 테스트 해보고 하는 쪽으로 사용할 때는
간편하게 쓸 수 있는 앱이 더 낫습니다.
다만, 딱 모델만 사용하기에는 부족함이 있습니다.
스킬 지원도 하고, 웹 서치도 되어야 하고...
간단한 프로젝트일지라도 RAG를 따로 설치하지 않아도.. 기본 지원 되어 사용의 연속성도 있어야 하고요.
이러한 포지션이 웹UI도 있고, 최근에는 언슬로스 스튜디오가 나와
더 나은 성능과 기능으로 대안이 되고 있습니다만,
설치 과정이 터미널을 이용해야 해서, 일반인의 접근성이 떨어집니다.
# 대중의 니즈를 통합 제공.
아울로 기사를 보고 들어가 살펴 보니, 어떤 의도를 담고 있는지 바로 파악이 되었습니다.
왜냐면.. 그런 앱이 나올 시기가 이미 지났다고 보고 있었거든요.
이미 나와 있어야 하는데 나와 있지 않은 이상한 상황이라 생각했습니다.
다운 받아 설치 하면 다른 어떤 것도 할 필요 없이 그냥 앱 자체로 모두 지원되는 것을 말이죠.
쉽게 말해 일반 소비자용 채팅 서비스와 코워크, 학습, 이런 것들을 모두 통합 지원하고,
심지어 모델을 따로 받을 필요 없이 내장 된 경량 모델이 작동하며,
보다 깊은 추론이 필요할 경우 기존 알려진 모델을 클라우드에서 불러 쓸 수 있는데...
무료...
라는 것인데요.
# 로컬 AI서버 개념 같습니다.
대개 깃허브에 올라와 있는 오픈 소스들의 설치에 필요한 과정을
인스톨러로 만든 것으로 보입니다.
필요한 라이브러리를 모두 한 큐에 설치 해주는 방식으로
로컬 서버를 돌려 내부적으로 모델을 돌리고 채팅이 될 뿐만 아니라
외부에서 이 서버에 접속이 되도록 지원도 하고요.
관건은 경량 모델의 성능이 어느 정도 일지... 설치 해보고 후기를 남겨 보겠습니다.
그리고 기존 로컬 모델도 불러 올 수 있다는데... 올라마나 Lm studio에서 가져올 수 있는 것인지도 궁금합니다.
제 생각은 그냥 로컬 모델을 아울로의 클라우드가 아니라 직접 불러오는 기존 방식도 같이 지원 되면 좋겠는데,
이건 설치를 해봐야 알겠습니다.
평생 무료라고 하는 것을 보면 수익 모델은 아무래도 캐릭터 닷컴이나
유료 모델을 통합 제공하는 크레딧이나... 이런 쪽으로 하지 않을까 싶습니다.
또 다른 경우로는 법률 전문 학습 모델로 실제 법무법인과 연결한다던지...
앱 자체에 광고가 들어갈 수도 있고요.
여튼, 오픈 소스에서 제공하는 기능들을 모두 통합 지원하면서 계속 무료라는 점은,
강력한 유인책이 될 것 같습니다.
컨셉은 좋은데, 실제 사용 만족도가 높은가 여부... 는 앞서와 마찬가지로 설치 해보고 후기 남기겠습니다.
오픈AI의 코덱스가 이런 통합 앱으로 가려는 것 같지만,
아무래도 뼈대가 개발 쪽이어서... 앱의 성격 자체는 조금 다른 것 같고,
기존에 오픈 웹 UI가 이런 식으로 갔었어야 하지 않나.. 하는 생각도 듭니다.
덧)
아무래도 젬마4가 나온 시점이라 의미가 어느 정도 있는 것 같다는 생각도 듭니다.
이 정도 안 되는데 로컬을 서비스하겠다며 앱을 내놓아도... 별로 쓸 것 같지 않아서요.
앞으로 소버린 AI가 본격 개발이 되고 승자가 정해지면.. 그 모델도 이런 앱으로 이용하면 괜찮겠다는 생각이 듭니다.
후기)
LM Studio에 일부 기능을 더한 정도에 머물러 있습니다.
아직 많이 아쉽네요.
제 글카가 9070인데...젬마4-4B를 돌리는데도 우렁찬 소리가 나는군요.
아무래도 올라마나 Lmstudio 정도의 최적화 성능이 안 되는 것 아닌가 싶습니다.
고작 4B짜리가 이렇게 속도가 느린 것도 이상하구요.
그런데 아직 기능적으로 아쉬운 대목이 있긴 하지만,(지원 된다는 기능 중 여러 가지가 안 됩니다. 할 예정이라고...)
편리함 면에서는 가능성이 높아 보입니다.
마켓 플레이스에서의 모델 다운로드는 회사에서 직접 어떤 사람이 쓰기에 좋은지를 안내해주고 있는데,
사실 잘 모르는 사람은 설치를 하고 나서도 어떤 모델을, 어떤 스킬을 써야 하는지
바로 감을 못 잡을 때가 있습니다. 익숙한 사람이야 상관 없겠지만요.
암튼, 바로 어떤 점에서 어떤 장점이 있는지 정보를 제공해주고 있어서,
모든 것이 초보자에 맞춰져 있습니다.
아직 전문가용 기능은 없는 상태네요.
손 쉬운 모델, 스킬의 설치 및 관리, 현재까지는 이 점이 강점으로 보입니다.

아무래도 이 앱의 초기 수익은 마켓플레이스 활성화 같습니다.
앱이 인기 많아지면 GPTs처럼 유료 스킬 같은 것들을 통해 수수료를 채우는...
그 외의 어떤 수익 모델을 만들지는....현재 앱 상태로는 알 수 없군요.
자체 학습한 8B짜리 모델도 제공이 되어서 테스트를 해보았는데...
....없는 셈 치고 Qwen3.5 9B가 지원 되면... 이걸쓰는 것이 나을 것 같습니다.
결론.
나름 기대치가 높았던 것에 비하면...아직 정착을 말하기엔...
기능이 제한적이어서 앞으로 업데이트 되는 것을 보고 판단해야 할 것 같습니다.
선발대의 의견은... 좀 더 지켜 보시죠. 지금은 메리트가 커 보이지 않습니다.
왜 이렇게 느린가... 생각해 보았는데,
아무래도 AMD 글카여서 그럴지도 모른다는 생각이 듭니다.
4B짜리면 제 9070이면...슥 슥 하면 다 출력이 되어야 하는데,
너무 느렸거든요.
엔비디아 GPU를 쓰신다면...괜찮은 선택이 될 수도 있겠지만,
결론에 적은대로 메리트가 아직은 크지 않은 것 같습니다.
이 앱이 메리트가 커지려면...
아무래도 개인이 설정하기 어려운... 문외한은 개념잡기 어려운,
잘 만들어진 스킬을 각 업무에 맞게 제공해주게 되면...
그 지점부터 쓸모가 좀 있게 되지 싶다는 생각이 듭니다.
지금은... 제공 되는 스킬을 보면...
너무 단순해서...의미를 두기 어려운 수준이더군요.
전문가의 튜닝을 거친 스킬... 이 아닌...
https://blog.owllo.ai/ko/72/
"예를 들어서, 사용자 파일과 폴더에 접근해서 내용을 파악하거나, 그것을 정리해주는 것, 다양한 AI 들과 통신하면서 사용할 수 있는 AI 커뮤니케이션 스킬 등 인데요, 이런 것들은 저희 팀에서도 바로 공개하기에는 조금 더 신중한 접근으로 다가가는 목소리가 많았습니다. 편리를 추구하는 툴에서 조금이라도 오류가 있다면 많은 불편을 줄 수 있도록 이 부분은 모든 걸 한 번에 공개한다기 보다는 순차적으로 공개하기로 결정했습니다."
아마도 바로 스킬들 공개해서 문제생기면 안돼서 테스트중인가 싶기도 한데, 말씀하신대로 앞으로 업데이트가 어떻게되는지가 관건인것 같습니다.
판단할 꺼리가 아직 없는 것 같습니다.
왜냐면...
저도 그 글을 봤지만, 다 맞는 얘기가 아니어서요.
여기서 말하는 '조금이라도 오류가 있다면'의 전제는 주로 '쓰기' 권한에 있는데요.
이 쓰기 권한이 필요 없는 일도 많습니다.
주로 지침으로 해결 가능한 영역들이죠.
그러한 예시가 보였다면...좋겠지만,
지금 사용 가능한 스킬 내용을 들어가 보면...
사실 없어도 무방한 정도의 몇줄짜리 지침이어서...
저도 프롬프트 엔지니어링을 통해
15개쯤 되는 파일로 지침 문서를 만들어 쓰고 있는데요.
정교한 지침을 만들기 위해 깎고 또 깎아내는 과정을 거치고 있습니다.
그 과정에 나름 이쪽으로 특출난 사람들의 것도 살펴보고는 하는데,
그런 흔적이 전혀 안 보였습니다.
즉, 그러한 손길이 닿은 스킬을 보게 되면,
아! 이 팀은 진짜 실력이 있구나... 라는 것을 짐작해 볼 수 있을텐데,
아직은 어떤 근거 자체가 없어서... 평가도 어렵네요.
CPU : AMD 라이젠5, 램 64기가, VGA : NVidia RTX3060(12기가), SSD : 500기가
대화패턴 : 대화하듯 물건 배송하기 (어디에서 어디로 어떤물건을 몇시에 보내줘~~)
[아주 가벼운 모델]
대화를 잘 이해하지 못하고, 하더라도 대화의 맥락(추론)을 원하는 방향대로 가지 않더라구요.
[중형모델]
모델사이즈 대략 48기가정도?
일상 대화도 잘 되고, 대화의 맥락을 잘 이해합니다.
대충 말(채팅)해도, 어떤 의도인지 어떤 목적인지까지는 파악을 하더라구요.
[나름 대형모델]
일단 VGA가 따라가지 못합니다.
못해도 100기가 이상의 용량을 잡아먹더라도 로컬에서 돌릴 수 있는 환경이 안되더라구요.
동작방식>
웹에서 채팅하듯 AI 서버에 대화를 전달 -> 분석하여, 출발지/도착지/물건/시간.. 등등 파싱--> 배송관제 시스템에 데이터 전달 ( 실제 기사님 배정, 배송)
* 요즘 AI서비스가 대세인지라, 어느정도까지 지원하능할까 싶었는데, 가능성이 없지않습니다.