앗, 저도 그렇습니다ㅠ 특히 Opus 4.6 -> 4.7로 넘어오면서 한국어 출력뿐만 아니라 동작들도 좀 달라진거 같더라구요. 가끔씩 코드 작성하다가 멈추는 경우도 잦아진거 같은 기분이고요.
이번 달부터는 Claude 5x Max 외에 ChatGPT Pro Lite를 함께 구독하면서 이것저것 비교해보고 있는데, 뭘 해야 할지 적당히 정리해주면 작업을 완수하는 것은 Codex가 더 나은 것 같은 기분입니다. 작업 중에 Steering으로 다른 작업을 지시하면 완료하고 다시 원래하던 작업으로 돌아오는 것도 잘하는 것 같고요.
말씀해주신 것처럼 엎치락뒤치락하면서 다시 Opus 모델의 성능이 더 좋아질 시기가 다시 올 것 같기는 해서 미련이 남기는 하는데, 카드 사용 내역을 보면.... orz 설 연휴 때 늦장부리다가 ChatGPT Pro 사용권 못 사둔걸 이렇게 후회하게 될 줄은 몰랐네요
그런 생각도 있지만 ㅎ... 그때는 그게 맞는 선택이었다는 생각도 드네요 codex 성능이 좋아지기 시작한게 4월쯤 부터다 보니 ㅠ 제미나이도 3.5 나오면서 정신 차려주면 좋겠는데 ㅎ... cli에서는 여전히 맥락을 잘 못 잡는 거 같습니다.(한 번 깃 하드리셋 한 경험 당하고 나서는 진짜 코드 하나도 못 맡기겠더라구요)
Gemini CLI는 시작부터가 너무 느려서 제가 뭔가 설치/설정을 잘못했나 싶었는데 GitHub Issue들을 봐도 다들 비슷한 증상을 호소하고 있더라고요ㅠ 시작부터 사용자 경험이 좋지 않아서 코딩은 맡기지도 않았더니, 다행스럽게도 큰 사고는 경험하지 못했는데... Antigravity CLI는 어떨지 모르겠네요. CLI면 뭔가 빠릿빠릿(?)한 맛이 있어야 할 것 같은데 내부에서는 다른 도구를 사용하는지;;
성능이 상향 평준화되면서 로컬 모델들이 쓸만해질 때까지는 토큰 값이 오르는 추세를 보일 것 같은데, 그 전까지 적당한 가격에 안정적으로 쓸 수 있는 도구가 나오면 좋겠습니다ㅠ
저도 4.7로 업데이트하고 최근 한달정도 더 멍청해진거같다는느낌이 들었어요. 맥락을 파악을 못한다던가, 예전에 정해둔 규칙과 코드를 맘대로 수정한다던가요. 그래서 최근엔 codex 5.5를 주로 사용했습니다. 연단위 결제로 claude를 잡아놨더니 해지도 못하고 속만 썩였는데... 다행히도 이번에 오픈한 opus 4.8은 확실히 괜찮은거같네요. 아직까지는요.