[삼성 이영진] 글로벌 AI/SW
순다르 피차이, MCP를 채택할지 말지 고민이라는 코멘트 : MCP(Model Context Protocol)는 앤스로픽의 오픈소스 프로토콜. AI 시스템을 다양한 외부 데이터 소스 및 툴과 연결하는 표준화된 방법. 통합 복잡성을 줄이고, 풍부한 컨텍스트를 활용하게 하는 일종의 USB 포트 같은 역할 : 오픈AI 직원 스티븐 하이델은 오픈AI는 이미 MCP를 지원하고 있다는 댓글
구글의 MCP 지원을 시사하는 순다르 피차이 코멘트와 MCP에 대한 하사비스의 의견
“MCP는 훌륭한 프로토콜이며, AI 에이전트 시대를 위한 오픈 표준으로 빠르게 자리 잡고 있습니다. 저희는 Gemini 모델과 SDK에서 MCP를 지원할 것임을 발표하게 되어 매우 기쁩니다. MCP 팀 및 업계의 다른 파트너들과 함께 이를 더욱 발전시켜 나가길 기대합니다.”
“MCP는 훌륭한 프로토콜이며, AI 에이전트 시대를 위한 오픈 표준으로 빠르게 자리 잡고 있습니다. 저희는 Gemini 모델과 SDK에서 MCP를 지원할 것임을 발표하게 되어 매우 기쁩니다. MCP 팀 및 업계의 다른 파트너들과 함께 이를 더욱 발전시켜 나가길 기대합니다.”
👍1
xAI, Grok 3 API 가격 공개
Grok 3
: 인풋 $3 및 아웃풋 $15(Fast 모드 $5 및 $25)
Grok 3 mini
: 인풋 $0.3 및 아웃풋 $0.5(Fast 모드 $0.6 및 $4)
(참고) 경쟁 모델 API 가격(/백만토큰)
구글 Gemini 2.5 Pro
: 인풋 $1.25 및 아웃풋 $10(토큰 20만 미만)
: 인풋 $2.5 및 아웃풋 $15(토큰 20만 초과)
앤스로픽 Claude 3.7 Sonnet
: 인풋 $3 및 아웃풋 $15
오픈AI GPT-4o
: 인풋$5 및 아웃풋 $15
구글 Gemini 2.0 Flash
: 인풋 $0.1 및 아웃풋 $0.4
Grok 3
: 인풋 $3 및 아웃풋 $15(Fast 모드 $5 및 $25)
Grok 3 mini
: 인풋 $0.3 및 아웃풋 $0.5(Fast 모드 $0.6 및 $4)
(참고) 경쟁 모델 API 가격(/백만토큰)
구글 Gemini 2.5 Pro
: 인풋 $1.25 및 아웃풋 $10(토큰 20만 미만)
: 인풋 $2.5 및 아웃풋 $15(토큰 20만 초과)
앤스로픽 Claude 3.7 Sonnet
: 인풋 $3 및 아웃풋 $15
오픈AI GPT-4o
: 인풋$5 및 아웃풋 $15
구글 Gemini 2.0 Flash
: 인풋 $0.1 및 아웃풋 $0.4
👍3❤1
Google Cloud Next ‘25, 빨라지는 AI 에이전트의 시대
안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.
최근 구글의 폼은 남다릅니다. GPT, 클로드, 그록3 등 탑티어 경쟁사를 압도하는 퍼포먼스를 보여주고 있습니다.
경쟁력의 비밀은 풀스택 AI 입니다. 모델의 성능, 가격 그 무엇 하나 빠지지 않습니다.
오픈AI가 넷츠케이프(선각자)라면 현재 알파벳은 익스플로러에 비교해 볼 수 있습니다. 물론 당장 오픈AI가 망하지는 않겠지만요.
구글은 이번 행사에서도 다양한 영역에서 최고, 최신의 경쟁력을 증명했습니다.
1) 블랙웰에 비견되는 7세대 TPU Ironwood(이전 세대 대비 컴퓨팅 성능 5배 향상, HBM 용량 6배(192 GB), FP8)
2) 내부에서만 사용하던 초고속, 저지연 네트워크인 WAN(Wide Area Network)을 기업용 클라우드로 출시
3) AI 워크로드를 위한 하이퍼컴퓨터 성능 업그레이드(엔비디아 최신 GPU 도입)
4) 소프트웨어 혁신(AI에 최적화된 쿠버네티스 엔진, Gemini 모델 학습에 활용되었던 분산처리 시스템인 Pathway 오픈)
5) 다양한 고성능 모델들을 Vertex AI로 통합 제공Gemini 2.5 Pro, Flash, Veo 2(영상), Imagen 3(이미지), Chirp 3(음성), Lyria(음악)
개인적으로 가장 주목하는 것은 AI 에이전트 프로토콜인 A2A(Agent2Agent)입니다. 클로드의 MCP가 호출에 따라 특정 기능을 수행하는 펑션 콜링에 특화되었다면 A2A는 에이전트들이 직접 협업하는 방식을 표준화했습니다.
즉, 서로 생태계 싸움을 하는 경쟁 관계가 아니라 전체 생태계를 이루는 보완재 역할을 하며 AI 에이전트 시대의 가속화를 만들어내고 있는 상황입니다.
마치 과거 앱스토어가 등장하며 다양한 앱들이 쏟아져 나온 것과 비슷합니다. 향후 수개월 전후로 놀라운 모멘텀이 만들어질 가능성이 높아졌습니다.
당장 숫자에 반영이 되지 않는다고 해서 초조해할 필요는 없습니다. 챗GPT가 보여줬던 것처럼, 거대한 기술의 흐름이 만들어지면 결국 시간의 문제이기 때문입니다.
AI 시대의 진정한 강자로 거듭나고 있는 구글에 대한 지속적인 관심이 필요하다는 생각입니다.
자세한 내용은 보고서를 참고 부탁드립니다.
감사합니다.
보고서 링크: https://bit.ly/4johhPk
(2025/4/10 공표자료)
안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.
최근 구글의 폼은 남다릅니다. GPT, 클로드, 그록3 등 탑티어 경쟁사를 압도하는 퍼포먼스를 보여주고 있습니다.
경쟁력의 비밀은 풀스택 AI 입니다. 모델의 성능, 가격 그 무엇 하나 빠지지 않습니다.
오픈AI가 넷츠케이프(선각자)라면 현재 알파벳은 익스플로러에 비교해 볼 수 있습니다. 물론 당장 오픈AI가 망하지는 않겠지만요.
구글은 이번 행사에서도 다양한 영역에서 최고, 최신의 경쟁력을 증명했습니다.
1) 블랙웰에 비견되는 7세대 TPU Ironwood(이전 세대 대비 컴퓨팅 성능 5배 향상, HBM 용량 6배(192 GB), FP8)
2) 내부에서만 사용하던 초고속, 저지연 네트워크인 WAN(Wide Area Network)을 기업용 클라우드로 출시
3) AI 워크로드를 위한 하이퍼컴퓨터 성능 업그레이드(엔비디아 최신 GPU 도입)
4) 소프트웨어 혁신(AI에 최적화된 쿠버네티스 엔진, Gemini 모델 학습에 활용되었던 분산처리 시스템인 Pathway 오픈)
5) 다양한 고성능 모델들을 Vertex AI로 통합 제공Gemini 2.5 Pro, Flash, Veo 2(영상), Imagen 3(이미지), Chirp 3(음성), Lyria(음악)
개인적으로 가장 주목하는 것은 AI 에이전트 프로토콜인 A2A(Agent2Agent)입니다. 클로드의 MCP가 호출에 따라 특정 기능을 수행하는 펑션 콜링에 특화되었다면 A2A는 에이전트들이 직접 협업하는 방식을 표준화했습니다.
즉, 서로 생태계 싸움을 하는 경쟁 관계가 아니라 전체 생태계를 이루는 보완재 역할을 하며 AI 에이전트 시대의 가속화를 만들어내고 있는 상황입니다.
마치 과거 앱스토어가 등장하며 다양한 앱들이 쏟아져 나온 것과 비슷합니다. 향후 수개월 전후로 놀라운 모멘텀이 만들어질 가능성이 높아졌습니다.
당장 숫자에 반영이 되지 않는다고 해서 초조해할 필요는 없습니다. 챗GPT가 보여줬던 것처럼, 거대한 기술의 흐름이 만들어지면 결국 시간의 문제이기 때문입니다.
AI 시대의 진정한 강자로 거듭나고 있는 구글에 대한 지속적인 관심이 필요하다는 생각입니다.
자세한 내용은 보고서를 참고 부탁드립니다.
감사합니다.
보고서 링크: https://bit.ly/4johhPk
(2025/4/10 공표자료)
👍1
[삼성 이영진] 글로벌 AI/SW
포켓몬 게임을 플레이하는 Claude 3.7 Sonnet > 초기 시도는 부진. 24년 6월 3.5 Sonnet은 의무 배틀을 회피하는 모습. Claude는 명시적으로 비디오 게임을 플레이 하도록 훈련되지 않음 > 일부 경우에는 구석에 갇혀서 무언가 고장났다고 확신하며 게임 리셋 요청 > 24년 10월 뉴 3.5 Sonnet은 개선 조짐. 처음으로 경쟁자를 이기고 태초마을을 벗어남 > 지난 주 3.7 Sonnet 테스트 결과 몇 시간만에 웅이를 이기고…
Twitch
Gemini_Plays_Pokemon - Twitch
Gemini 3 Pro plays Pokémon Crystal - (Almost) Vision-Only | !askgem [!faq !harness]
👍1😁1
오픈AI, 신규 모델 관련 보도(The Verge)
: 소식통을 인용해 다음주 GPT-4o 멀티모달 모델을 개선한 GPT-4.1와 4.1 Mini 및 Nano 버전 출시 예정이라는 보도
: 최근 웹 버전 코드에서 발견된 o3와 o4 mini도 유사한 출시 타임라인 언급
https://www.theverge.com/news/646458/openai-gpt-4-1-ai-model
: 소식통을 인용해 다음주 GPT-4o 멀티모달 모델을 개선한 GPT-4.1와 4.1 Mini 및 Nano 버전 출시 예정이라는 보도
: 최근 웹 버전 코드에서 발견된 o3와 o4 mini도 유사한 출시 타임라인 언급
https://www.theverge.com/news/646458/openai-gpt-4-1-ai-model
The Verge
OpenAI gets ready to launch GPT-4.1
o4 mini and o3 might also debut next week
👍3
[삼성 이영진] 글로벌 SW 헤드라인 (25/4/11)
■ 오픈AI, 챗GPT 내 신규 장기 메모리 기능 도입. 이전 대화를 모두 참고해 개인화된 응답 제공. Pro 및 Plus 구독자 우선 제공
■ 오픈AI, 다음주 GPT-4.1 시리즈와 o3, o4-mini 등을 출시한다는 보도
■ 오픈AI, AI 에이전트가 복잡하고 찾기 어려운 인터넷 정보를 검색하고 추론하는 능력을 평가하기 위한 벤치마크 BrowseComp 공개
■ 구글, 미국 연방 조달청(GSA)와 계약을 통해 구글 Workspace 가격을 기존 대비 71% 할인해 제공
■ 구글, 앤스로픽의 MCP를 자사 AI 모델과 SDK에 도입 예정
■ 데미스 하사비스, 궁극적으로 Gemini와 Veo 모델의 결합 계획 언급
■ 앤디 제시, 주주 서한을 통해 AI는 우리가 알고 있는 모든 것을 재창조하는 기회라며 기업의 AI에 대한 공격적 투자 주장
■ 마이크로소프트, 주요 AI 모델이 소프트웨어 디버깅 작업에서 제한적 성과를 보였다는 연구 결과 발표
■ 일론 머스크, Grok 3.5는 주요 업그레이드와 함께 곧 출시 예정이며, Grok 4는 올해 말 출시 예정이라 코멘트
■ xAI, Grok 3 시리즈 API 가격 공개. Grok 3는 인풋 $3 및 아웃풋 $15으로 앤스로픽 Cluade 3.7 Sonnet과 유사한 수준
■ 미라 무라티의 Thinking Machines Lab, 100억 달러 밸류로 20억 달러 시드 펀딩 추진
■ 스노우플레이크, 국방부 IL5 보안 등급 획득을 통해 민감 데이터 처리 자격 확보. 가장 높은 보안 등급은 IL6
■ 캔바, Visual Suite 2.0 업데이트를 통해 다양한 AI 기반 기능 추가
감사합니다.
■ 오픈AI, 챗GPT 내 신규 장기 메모리 기능 도입. 이전 대화를 모두 참고해 개인화된 응답 제공. Pro 및 Plus 구독자 우선 제공
■ 오픈AI, 다음주 GPT-4.1 시리즈와 o3, o4-mini 등을 출시한다는 보도
■ 오픈AI, AI 에이전트가 복잡하고 찾기 어려운 인터넷 정보를 검색하고 추론하는 능력을 평가하기 위한 벤치마크 BrowseComp 공개
■ 구글, 미국 연방 조달청(GSA)와 계약을 통해 구글 Workspace 가격을 기존 대비 71% 할인해 제공
■ 구글, 앤스로픽의 MCP를 자사 AI 모델과 SDK에 도입 예정
■ 데미스 하사비스, 궁극적으로 Gemini와 Veo 모델의 결합 계획 언급
■ 앤디 제시, 주주 서한을 통해 AI는 우리가 알고 있는 모든 것을 재창조하는 기회라며 기업의 AI에 대한 공격적 투자 주장
■ 마이크로소프트, 주요 AI 모델이 소프트웨어 디버깅 작업에서 제한적 성과를 보였다는 연구 결과 발표
■ 일론 머스크, Grok 3.5는 주요 업그레이드와 함께 곧 출시 예정이며, Grok 4는 올해 말 출시 예정이라 코멘트
■ xAI, Grok 3 시리즈 API 가격 공개. Grok 3는 인풋 $3 및 아웃풋 $15으로 앤스로픽 Cluade 3.7 Sonnet과 유사한 수준
■ 미라 무라티의 Thinking Machines Lab, 100억 달러 밸류로 20억 달러 시드 펀딩 추진
■ 스노우플레이크, 국방부 IL5 보안 등급 획득을 통해 민감 데이터 처리 자격 확보. 가장 높은 보안 등급은 IL6
■ 캔바, Visual Suite 2.0 업데이트를 통해 다양한 AI 기반 기능 추가
감사합니다.
👍2
미국 정부 소프트웨어 시장에 드리운 변화의 폭풍
안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.
구글이 미국 연방조달청(GSA)과 계약을 통해 연방 정부 기관 대상 구글 워크스페이스(Google Workspace) 소프트웨어 제품군을 할인 제공할 계획입니다.
9/30일까지 유효한 임시 가격이지만 모든 연방 기관의 대상으로 기존 다수공급자계약(MAS) 프로그램 대비 71% 할인된 가격인데요
개별 기관 또는 거래별 협상을 통해 할인을 받는 형태에서 연방 정부를 하나의 고객으로 간주하고 전체 구매량을 기준으로 가격을 책정하는 형태입니다.
GSA는 워크스페이스 분야를 넘어 GCP(구글 클라우드)의 가격 경쟁력 확대를 위한 노력도 하고 있다고 언급했네요
GSA 입장에서는 중복 감소와 IT 조달 간소화를 목표로 정부 기관의 구매력을 비용 절감을 위한 협상 카드로 제시한 것입니다. 정부 기관 내 전체적으로 채택될 경우 3년간 최대 20억 달러 비용 절감을 추정하고 있습니다.
이러한 움직임은 연방 지출을 줄이려는 트럼프 행정부의 노력과 머스크가 주도하는 DOGE 활동의 연장선입니다. DOGE는 출범 이후 정부 기관의 과도한 소프트웨어 지출 및 낭비에 대한 조사를 지속하고 있으니까요
GSA는 구글 외 다른 기업과도 관련 협력을 진행하고 있으며, 이번 계약은 IT 비용을 절감하려는 노력의 '이정표'라고 언급했습니다. 유사한 형태의 추가 발표 가능성도 높아보이네요
단기적으로 정부 소프트웨어 시장 내 IT 지출 효율성을 우선시 하는 가격 정책이 도입 될 것입니다.
서비스나우, 유아이패스, 액센츄어 등의 실적에서 대두된 정부 IT 지출 불확실성이 오히려 할인과 같은 계약 조건을 통해 해소된다면 나쁠 것은 없습니다.
물론 소프트웨어 기업 입장에서는 P를 낮춰준 만큼 Q가 늘어날 수 있는지가 중요합니다.
경쟁 측면 변화도 주목해야합니다. 변화에 보수적인 태도와 비용 민감도가 낮은 특성에 따라 정부 소프트웨어 시장은 일반 엔터프라이즈 시장 대비는 경쟁이 치열하지 않은 분야였습니다.
기존 강자로 꼽혔던 마이크로소프트나 오라클 등의 정부 소프트웨어 시장 점유율에 변화가 생길지 여부를 예의주시해야합니다. 추가 업데이트해 드리겠습니다.
(2025/4/11 공표자료)
안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.
구글이 미국 연방조달청(GSA)과 계약을 통해 연방 정부 기관 대상 구글 워크스페이스(Google Workspace) 소프트웨어 제품군을 할인 제공할 계획입니다.
9/30일까지 유효한 임시 가격이지만 모든 연방 기관의 대상으로 기존 다수공급자계약(MAS) 프로그램 대비 71% 할인된 가격인데요
개별 기관 또는 거래별 협상을 통해 할인을 받는 형태에서 연방 정부를 하나의 고객으로 간주하고 전체 구매량을 기준으로 가격을 책정하는 형태입니다.
GSA는 워크스페이스 분야를 넘어 GCP(구글 클라우드)의 가격 경쟁력 확대를 위한 노력도 하고 있다고 언급했네요
GSA 입장에서는 중복 감소와 IT 조달 간소화를 목표로 정부 기관의 구매력을 비용 절감을 위한 협상 카드로 제시한 것입니다. 정부 기관 내 전체적으로 채택될 경우 3년간 최대 20억 달러 비용 절감을 추정하고 있습니다.
이러한 움직임은 연방 지출을 줄이려는 트럼프 행정부의 노력과 머스크가 주도하는 DOGE 활동의 연장선입니다. DOGE는 출범 이후 정부 기관의 과도한 소프트웨어 지출 및 낭비에 대한 조사를 지속하고 있으니까요
GSA는 구글 외 다른 기업과도 관련 협력을 진행하고 있으며, 이번 계약은 IT 비용을 절감하려는 노력의 '이정표'라고 언급했습니다. 유사한 형태의 추가 발표 가능성도 높아보이네요
단기적으로 정부 소프트웨어 시장 내 IT 지출 효율성을 우선시 하는 가격 정책이 도입 될 것입니다.
서비스나우, 유아이패스, 액센츄어 등의 실적에서 대두된 정부 IT 지출 불확실성이 오히려 할인과 같은 계약 조건을 통해 해소된다면 나쁠 것은 없습니다.
물론 소프트웨어 기업 입장에서는 P를 낮춰준 만큼 Q가 늘어날 수 있는지가 중요합니다.
경쟁 측면 변화도 주목해야합니다. 변화에 보수적인 태도와 비용 민감도가 낮은 특성에 따라 정부 소프트웨어 시장은 일반 엔터프라이즈 시장 대비는 경쟁이 치열하지 않은 분야였습니다.
기존 강자로 꼽혔던 마이크로소프트나 오라클 등의 정부 소프트웨어 시장 점유율에 변화가 생길지 여부를 예의주시해야합니다. 추가 업데이트해 드리겠습니다.
(2025/4/11 공표자료)
👍3❤2
[삼성 이영진] 글로벌 SW 기업 주요 일정(현지시간)
실적(E)은 잠정 일정으로 향후 변동 가능
■ 4월 4주 차
SAP(SAP DE) - 4/22
서비스나우(NOW) - 4/23
IBM(IBM) - 4/23
아마존(AMZN) - 4/24(E)
■ 5월 1주 차
메타 LlamaCon - 4/29
알파벳(GOOGL) - 4/29(E)
마이크로소프트(MSFT) - 4/30
메타 플랫폼스(META) - 4/30
허브스팟(HUBS) - 4/30(E)
애플(AAPL) - 5/1
데이터도그(DDOG) - 5/1(E)
클라우드플레어(NET) - 5/1(E)
■ 5월 2주 차
팔란티어 테크놀로지스(PLTR) - 5/5(E)
서비스나우 Knowledge - 5/6~8
앱러빈(APP) - 5/7
포티넷(FTNT) - 5/7
트레이드 데스크(TTD) - 5/7(E)
■ 5월 3주 차
유니티 소프트웨어(U) - 5/13(E)
■ 5월 4주 차
구글 I/O - 5/20~21
마이크로소프트 Build - 5/20~22
팔로알토 네트웍스(PANW) - 5/21(E)
스노우플레이크(SNOW) - 5/21(E)
워크데이(WDAY) - 5/22(E)
■ 5월 5주 차
세일즈포스(CRM) - 5/28(E)
크라우드 스트라이크(CRWD) - 5/29(E)
몽고DB(MDB) - 5/29(E)
엘라스틱(ESTC) - 5/29(E)
지스케일러(ZS) - 5/29(E)
■ 6월 1주 차
스노우플레이크 서밋 - 6/2~5
■ 6월 2주 차
데이터브릭스 Data+AI 서밋 6/9~12
오라클(ORCL) - 6/10(E)
어도비(ADBE) - 6/12
실적(E)은 잠정 일정으로 향후 변동 가능
■ 4월 4주 차
SAP(SAP DE) - 4/22
서비스나우(NOW) - 4/23
IBM(IBM) - 4/23
아마존(AMZN) - 4/24(E)
■ 5월 1주 차
메타 LlamaCon - 4/29
알파벳(GOOGL) - 4/29(E)
마이크로소프트(MSFT) - 4/30
메타 플랫폼스(META) - 4/30
허브스팟(HUBS) - 4/30(E)
애플(AAPL) - 5/1
데이터도그(DDOG) - 5/1(E)
클라우드플레어(NET) - 5/1(E)
■ 5월 2주 차
팔란티어 테크놀로지스(PLTR) - 5/5(E)
서비스나우 Knowledge - 5/6~8
앱러빈(APP) - 5/7
포티넷(FTNT) - 5/7
트레이드 데스크(TTD) - 5/7(E)
■ 5월 3주 차
유니티 소프트웨어(U) - 5/13(E)
■ 5월 4주 차
구글 I/O - 5/20~21
마이크로소프트 Build - 5/20~22
팔로알토 네트웍스(PANW) - 5/21(E)
스노우플레이크(SNOW) - 5/21(E)
워크데이(WDAY) - 5/22(E)
■ 5월 5주 차
세일즈포스(CRM) - 5/28(E)
크라우드 스트라이크(CRWD) - 5/29(E)
몽고DB(MDB) - 5/29(E)
엘라스틱(ESTC) - 5/29(E)
지스케일러(ZS) - 5/29(E)
■ 6월 1주 차
스노우플레이크 서밋 - 6/2~5
■ 6월 2주 차
데이터브릭스 Data+AI 서밋 6/9~12
오라클(ORCL) - 6/10(E)
어도비(ADBE) - 6/12
오픈AI, 안전성 테스트 축소 논란
: 파이낸셜 타임스(FT)는 오픈AI가 최신 AI 모델의 안전성 테스트에 투입하는 시간과 자원을 대폭 줄였다고 보도
: 과거 모델(GPT-4 등) 테스트에 수개월이 걸렸던 반면, 최근 모델(o3 등)은 며칠 만에 평가 진행
: 전문가들은 테스트 기간 단축으로 인해 모델의 잠재적 위험을 충분히 식별하고 완화하기 어려워졌다고 우려. 치열한 경쟁 속 신규 모델을 빠르게 출시하려는 압박감 때문으로 분석
: 오픈AI는 자동화 등으로 테스트 프로세스가 효율화 되었으며, 테스트 방법을 투명하게 공개하고 있고, 테스트 버전과 최종 버전이 거의 동일하다는 입장
: 파이낸셜 타임스(FT)는 오픈AI가 최신 AI 모델의 안전성 테스트에 투입하는 시간과 자원을 대폭 줄였다고 보도
: 과거 모델(GPT-4 등) 테스트에 수개월이 걸렸던 반면, 최근 모델(o3 등)은 며칠 만에 평가 진행
: 전문가들은 테스트 기간 단축으로 인해 모델의 잠재적 위험을 충분히 식별하고 완화하기 어려워졌다고 우려. 치열한 경쟁 속 신규 모델을 빠르게 출시하려는 압박감 때문으로 분석
: 오픈AI는 자동화 등으로 테스트 프로세스가 효율화 되었으며, 테스트 방법을 투명하게 공개하고 있고, 테스트 버전과 최종 버전이 거의 동일하다는 입장
👍4
오픈AI GPT-4.5 개발 과정 관련 유튜브 영상 요약
1. GPT-4.5에 대한 반응
출시 직후 예상보다 훨씬 긍정적인 반응을 얻음. 많은 사용자들이 GPT-4와는 확연히 다른 대화 품질을 체감했고, 그 차이를 설명하기 어려울 정도로 경험이 달랐다고 평가
2. 개발 기간과 준비 과정
GPT-4.5 훈련은 약 2년 전부터 시작. 새로운 컴퓨팅 자원을 염두에 둔 설계와 함께, 시스템·ML·데이터 전반의 광범위한 사전 테스트 및 리스크 제거 진행.
GPT-4는 현재 소규모 팀(5~10명)으로도 재훈련 가능하지만, GPT-4.5는 여러 팀 간 협업이 필요한 복잡하고 방대한 프로젝트
3. 목표와 성과
내부 목표는 GPT-4보다 10배 더 ‘똑똑한’ 모델을 만드는 것. 실질적인 연산 성능 기준으로 이 목표를 달성한 것으로 평가
4 대규모 학습의 복잡성
대규모 학습에선 예측 불가능한 문제들이 자주 발생.하드웨어 오류나 미묘한 소프트웨어 버그가 치명적인 이슈로 이어질 수 있음.해결되지 않은 문제를 안고 훈련을 시작해야 하는 경우도 많아, ‘완전 해결 후 시작’과 ‘진행하면서 해결’ 사이의 균형이 중요.
5. torch.sum 버그 사례
학습 중 PyTorch의 기본 함수(torch.sum)에서 희귀한 데이터 의존적 버그 발생.불법 메모리 접근으로 심각한 불안정성 유발.이 문제를 해결한 후 훈련 안정성과 ETA(남은 시간)가 크게 개선되었고, 팀 사기도 향상
6. 데이터의 한계와 효율성
향후 모델을 10~100배 더 키우기 위해선 데이터량이 가장 큰 병목 요소. 단순히 컴퓨팅 파워가 아닌, 더 적은 데이터로 더 많이 학습할 수 있는 알고리즘이 관건.현 모델들은 인간 대비 매우 비효율적인 데이터 사용을 하고 있음
7. 시스템 설계와 병목
시스템 안정성, 내결함성, 네트워크 견고성은 대규모 훈련의 핵심 인프라 요소.공동 설계를 통해 자원 부담을 나눌 수 있지만, 메모리 대역폭과 네트워크 병목은 여전히 큰 제약.
8. 미래 훈련 방식
향후 수천만 개 GPU를 활용한 대규모 훈련도 예상됨.이는 기존처럼 완전 동기화된 방식이 아닌, 반동기화·분산형 훈련 방식으로 발전할 가능성 큼
9. 핵심 인사이트 – 사전학습과 스케일링 법칙
언어 모델은 비지도 학습을 통해 데이터를 압축하려 하며, 이는 패턴, 연결, 추상화를 인식하는 방식
스케일이 커질수록 test loss(압축 성능)가 예측 가능하게 향상되며,그 과정에서 예기치 못한 일반 지능의 징후도 나타남.
중요한 것은 단순 암기가 아니라, 진정한 일반화 능력이며, 이를 위해선 엄선된 테스트셋을 통한 검증이 필수.
https://www.youtube.com/watch?v=6nJZopACRuQ
1. GPT-4.5에 대한 반응
출시 직후 예상보다 훨씬 긍정적인 반응을 얻음. 많은 사용자들이 GPT-4와는 확연히 다른 대화 품질을 체감했고, 그 차이를 설명하기 어려울 정도로 경험이 달랐다고 평가
2. 개발 기간과 준비 과정
GPT-4.5 훈련은 약 2년 전부터 시작. 새로운 컴퓨팅 자원을 염두에 둔 설계와 함께, 시스템·ML·데이터 전반의 광범위한 사전 테스트 및 리스크 제거 진행.
GPT-4는 현재 소규모 팀(5~10명)으로도 재훈련 가능하지만, GPT-4.5는 여러 팀 간 협업이 필요한 복잡하고 방대한 프로젝트
3. 목표와 성과
내부 목표는 GPT-4보다 10배 더 ‘똑똑한’ 모델을 만드는 것. 실질적인 연산 성능 기준으로 이 목표를 달성한 것으로 평가
4 대규모 학습의 복잡성
대규모 학습에선 예측 불가능한 문제들이 자주 발생.하드웨어 오류나 미묘한 소프트웨어 버그가 치명적인 이슈로 이어질 수 있음.해결되지 않은 문제를 안고 훈련을 시작해야 하는 경우도 많아, ‘완전 해결 후 시작’과 ‘진행하면서 해결’ 사이의 균형이 중요.
5. torch.sum 버그 사례
학습 중 PyTorch의 기본 함수(torch.sum)에서 희귀한 데이터 의존적 버그 발생.불법 메모리 접근으로 심각한 불안정성 유발.이 문제를 해결한 후 훈련 안정성과 ETA(남은 시간)가 크게 개선되었고, 팀 사기도 향상
6. 데이터의 한계와 효율성
향후 모델을 10~100배 더 키우기 위해선 데이터량이 가장 큰 병목 요소. 단순히 컴퓨팅 파워가 아닌, 더 적은 데이터로 더 많이 학습할 수 있는 알고리즘이 관건.현 모델들은 인간 대비 매우 비효율적인 데이터 사용을 하고 있음
7. 시스템 설계와 병목
시스템 안정성, 내결함성, 네트워크 견고성은 대규모 훈련의 핵심 인프라 요소.공동 설계를 통해 자원 부담을 나눌 수 있지만, 메모리 대역폭과 네트워크 병목은 여전히 큰 제약.
8. 미래 훈련 방식
향후 수천만 개 GPU를 활용한 대규모 훈련도 예상됨.이는 기존처럼 완전 동기화된 방식이 아닌, 반동기화·분산형 훈련 방식으로 발전할 가능성 큼
9. 핵심 인사이트 – 사전학습과 스케일링 법칙
언어 모델은 비지도 학습을 통해 데이터를 압축하려 하며, 이는 패턴, 연결, 추상화를 인식하는 방식
스케일이 커질수록 test loss(압축 성능)가 예측 가능하게 향상되며,그 과정에서 예기치 못한 일반 지능의 징후도 나타남.
중요한 것은 단순 암기가 아니라, 진정한 일반화 능력이며, 이를 위해선 엄선된 테스트셋을 통한 검증이 필수.
https://www.youtube.com/watch?v=6nJZopACRuQ
YouTube
Pre-Training GPT-4.5
Sam Altman sits down with Amin Tootoonchian, Alex Paino, and Daniel Selsam to discuss the journey to get to GPT-4.5.
👍4❤3
[삼성 이영진] 글로벌 SW 헤드라인 (25/4/14)
■ 팔란티어, DOGE와 미국 국세청(IRS)의 모든 데이터를 통합 관리할 수 있는 메가 API 개발 프로젝트 협력
■ 샘 올트먼, 이번주 신규 업데이트를 시사하는 X 포스팅 업로드
■ 샘 올트먼, 곧 공개할 오픈 웨이트 모델이 프론티어 모델에 근접한 성능을 갖출 것이라 코멘트
■ 사라 프라이어 오픈AI CFO, 내부적으로 A-SWE로 부르는 에이전트 기반 소프트웨어 엔지니어 프로젝트 언급
■ 오픈AI 전 직원 12명, 일론 머스크가 제기한 소송에 동참하며 영리 법인 전환 반대 의견 피력
■ 오픈AI, 최신 AI 모델의 안전성 테스트에 투입하는 시간과 자원의 축소 보도
■ 챗GPT, 3월 글로벌 앱 다운로드 4,600만 건으로 전월 대비 28% 증가. 순위에서 1위 차지
■ 오픈AI, API 형태로 제공되는 일부 고급 모델에 대한 접근에 대한 조직 인증 절차 Verified Organization 도입
■ 마이크로소프트, 오하이오주의 10억 달러 규모 데이터센터 건설 프로젝트 일부 중단 및 속도 조절 결정 보도
■ 일리야 수츠케버의 SSI 신규 펀딩 라운드에 구글과 엔비디아 참여 보도. SSI의 가치는 320억 달러로 평가
■ 메타 Llama 4 Maverick, 허깅페이스 공개 버전으로 재평가한 결과 LM아레나 순위 32등으로 하락
■ 넷플릭스, 오픈AI 기술을 활용한 신규 검색 기능 테스트. 유저의 기분이나 분위기 같은 구체적 포현 기반 콘텐츠 추천
■ EU, X 유저의 데이터 설정이 동의 없이 xAI의 Grok 학습에 활용된 것에 대한 조사 착수
■ 바이트댄스, AI 챗 봇 Doubao가 탑재된 AI 스마트 안경 개발 보도
감사합니다.
■ 팔란티어, DOGE와 미국 국세청(IRS)의 모든 데이터를 통합 관리할 수 있는 메가 API 개발 프로젝트 협력
■ 샘 올트먼, 이번주 신규 업데이트를 시사하는 X 포스팅 업로드
■ 샘 올트먼, 곧 공개할 오픈 웨이트 모델이 프론티어 모델에 근접한 성능을 갖출 것이라 코멘트
■ 사라 프라이어 오픈AI CFO, 내부적으로 A-SWE로 부르는 에이전트 기반 소프트웨어 엔지니어 프로젝트 언급
■ 오픈AI 전 직원 12명, 일론 머스크가 제기한 소송에 동참하며 영리 법인 전환 반대 의견 피력
■ 오픈AI, 최신 AI 모델의 안전성 테스트에 투입하는 시간과 자원의 축소 보도
■ 챗GPT, 3월 글로벌 앱 다운로드 4,600만 건으로 전월 대비 28% 증가. 순위에서 1위 차지
■ 오픈AI, API 형태로 제공되는 일부 고급 모델에 대한 접근에 대한 조직 인증 절차 Verified Organization 도입
■ 마이크로소프트, 오하이오주의 10억 달러 규모 데이터센터 건설 프로젝트 일부 중단 및 속도 조절 결정 보도
■ 일리야 수츠케버의 SSI 신규 펀딩 라운드에 구글과 엔비디아 참여 보도. SSI의 가치는 320억 달러로 평가
■ 메타 Llama 4 Maverick, 허깅페이스 공개 버전으로 재평가한 결과 LM아레나 순위 32등으로 하락
■ 넷플릭스, 오픈AI 기술을 활용한 신규 검색 기능 테스트. 유저의 기분이나 분위기 같은 구체적 포현 기반 콘텐츠 추천
■ EU, X 유저의 데이터 설정이 동의 없이 xAI의 Grok 학습에 활용된 것에 대한 조사 착수
■ 바이트댄스, AI 챗 봇 Doubao가 탑재된 AI 스마트 안경 개발 보도
감사합니다.
👍1
오픈AI의 세번째 에이전트 A-SWE
안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.
주말 간 오픈AI 샘 올트먼 CEO의 TED 2025 컨퍼런스와 사라 프라이어 CFO의 GS 테크 서밋(3월 초 진행) 발표 내용이 AI 씬에서 화제가 되었는데요
공통적으로 Agentic Software Engineering이라는 주제가 강조되었습니다.
샘 올트먼은 소프트웨어 개발에서 또 한 번의 거대한 변화가 다가오고 있으며, 에이전틱 소프트웨어 엔지니어링이 핵심이 될 것이라고 언급했고
사라 프라이어는 오퍼레이터, 딥 리서치에 이른 오픈AI의 세번째 에이전트인 코딩 에이전트 A-SWE(Agentic Software Engineer)에 대한 코멘트를 했습니다.
A-SWE는 단순한 코딩 자동화가 아닙니다. 기존 깃허브 코파일럿이 개발자를 보조하는 도구였다면, 이제는 실제 개발자처럼 일하는 에이전트가 등장했다고 주장했는데요
유저가 엔지니어에게 주는 것 처럼 PR(Pull Request)를 제공하면, 에이전트는 전체 어플리케이션을 직접 설계 및 구현하고, 개발자들이 기피하는 QA(품질 테스트), 버그 수정, 문서화까지 스스로 수행할 수 있습니다.
또한 향후 기업들은 해당 도구를 통해 소프트웨어 개발 역량을 획기적으로 확대 할 수 있게 될 것이라고 말했습니다.
단순한 생산성 도약이 아니라, 소프트웨어 개발 방식 자체의 패러다임 전환이며, 스스로 코드를 짜고 테스트하고 배포하는 ‘디지털 동료’의 시대가 열리고 있다는 분석입니다.
소프트웨어 기업들의 다양한 에이전트 출시가 이어지고 있지만, LLM의 발전 트렌드와 유사하게 '쓸 만한' 에이전트는 코딩 분야에서 먼저 출현할 확률이 높습니다.
그렇다면 A-SWE는 언제 출시될까요? 상반기가 유력하다고 이야가되고 있지만, 샘 올트먼은 이번주 다양한 신규 업데이트 발표를 시사했고, 모델 경쟁 선두로 나선 구글도 코딩 특화 모델을 준비하고 있는 만큼 전격 공개될 가능성도 배제할 수 없습니다.
단순 기술 경쟁을 넘어 API 가격 하락 트렌드와 챗GPT의 제한적 확장성(요금제 변화의 어려움)을 고려하면 매출 성장을 위해서 에이전트 기능의 성공적 안착은 불가피해 보이네요
큰 그림에서는 최근 보고서에 언급 드린것 처럼 AI 코딩의 발전이 소프트웨어 생태계에 미칠 영향도 지속 확인이 필요합니다.
(2025/4/14 공표자료)
안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.
주말 간 오픈AI 샘 올트먼 CEO의 TED 2025 컨퍼런스와 사라 프라이어 CFO의 GS 테크 서밋(3월 초 진행) 발표 내용이 AI 씬에서 화제가 되었는데요
공통적으로 Agentic Software Engineering이라는 주제가 강조되었습니다.
샘 올트먼은 소프트웨어 개발에서 또 한 번의 거대한 변화가 다가오고 있으며, 에이전틱 소프트웨어 엔지니어링이 핵심이 될 것이라고 언급했고
사라 프라이어는 오퍼레이터, 딥 리서치에 이른 오픈AI의 세번째 에이전트인 코딩 에이전트 A-SWE(Agentic Software Engineer)에 대한 코멘트를 했습니다.
A-SWE는 단순한 코딩 자동화가 아닙니다. 기존 깃허브 코파일럿이 개발자를 보조하는 도구였다면, 이제는 실제 개발자처럼 일하는 에이전트가 등장했다고 주장했는데요
유저가 엔지니어에게 주는 것 처럼 PR(Pull Request)를 제공하면, 에이전트는 전체 어플리케이션을 직접 설계 및 구현하고, 개발자들이 기피하는 QA(품질 테스트), 버그 수정, 문서화까지 스스로 수행할 수 있습니다.
또한 향후 기업들은 해당 도구를 통해 소프트웨어 개발 역량을 획기적으로 확대 할 수 있게 될 것이라고 말했습니다.
단순한 생산성 도약이 아니라, 소프트웨어 개발 방식 자체의 패러다임 전환이며, 스스로 코드를 짜고 테스트하고 배포하는 ‘디지털 동료’의 시대가 열리고 있다는 분석입니다.
소프트웨어 기업들의 다양한 에이전트 출시가 이어지고 있지만, LLM의 발전 트렌드와 유사하게 '쓸 만한' 에이전트는 코딩 분야에서 먼저 출현할 확률이 높습니다.
그렇다면 A-SWE는 언제 출시될까요? 상반기가 유력하다고 이야가되고 있지만, 샘 올트먼은 이번주 다양한 신규 업데이트 발표를 시사했고, 모델 경쟁 선두로 나선 구글도 코딩 특화 모델을 준비하고 있는 만큼 전격 공개될 가능성도 배제할 수 없습니다.
단순 기술 경쟁을 넘어 API 가격 하락 트렌드와 챗GPT의 제한적 확장성(요금제 변화의 어려움)을 고려하면 매출 성장을 위해서 에이전트 기능의 성공적 안착은 불가피해 보이네요
큰 그림에서는 최근 보고서에 언급 드린것 처럼 AI 코딩의 발전이 소프트웨어 생태계에 미칠 영향도 지속 확인이 필요합니다.
(2025/4/14 공표자료)
👍3
오픈AI 에이전트 연구원 Shunyu Yao의 「The Second Half」
요약
AI는 지금 ‘전반전’에서 ‘후반전’으로 접어들고 있음. 전반전은 모델과 학습 방법의 발전 중심이었고, 후반전은 문제 정의와 평가 중심의 시대
1. 전반전: 모델 중심의 시대
과거 AI의 발전은 대부분 새로운 학습 방법과 모델 개발에 집중. “Transformer”, “AlexNet”, “GPT” 등 획기적인 모델이 등장하며, 벤치마크 성능 개선. 주로 “어떻게 더 나은 모델을 만들 것인가?“에 초점
2. 후반전: 문제 정의 중심의 시대
이제는 강화학습(RL)이 일반화되고 다양한 작업을 하나의 레시피로 해결 가능. RL + 언어모델이 소프트웨어 개발, 창의적 글쓰기, 수학, 키보드/마우스 조작, 장문 질의응답까지 커버
“이 모델로 무엇을 해결할 수 있는가?”에서 “AI에게 무엇을 시켜야 하며, 어떻게 평가해야 하는가?”로 초점 변화. 제품 관리자(PM)처럼 문제를 정의하고 지표를 세울 줄 아는 역량이 중요
3. 후반전의 과제
“좋은 모델”을 넘어서 “좋은 문제 설정과 평가”가 AI 진화의 열쇠. 평가 지표가 부실하면 AI 진보도 왜곡. 앞으로는 AI 연구자가 아닌 ‘문제 설계자’로서의 사고 전환 필요
https://ysymyth.github.io/The-Second-Half/
요약
AI는 지금 ‘전반전’에서 ‘후반전’으로 접어들고 있음. 전반전은 모델과 학습 방법의 발전 중심이었고, 후반전은 문제 정의와 평가 중심의 시대
1. 전반전: 모델 중심의 시대
과거 AI의 발전은 대부분 새로운 학습 방법과 모델 개발에 집중. “Transformer”, “AlexNet”, “GPT” 등 획기적인 모델이 등장하며, 벤치마크 성능 개선. 주로 “어떻게 더 나은 모델을 만들 것인가?“에 초점
2. 후반전: 문제 정의 중심의 시대
이제는 강화학습(RL)이 일반화되고 다양한 작업을 하나의 레시피로 해결 가능. RL + 언어모델이 소프트웨어 개발, 창의적 글쓰기, 수학, 키보드/마우스 조작, 장문 질의응답까지 커버
“이 모델로 무엇을 해결할 수 있는가?”에서 “AI에게 무엇을 시켜야 하며, 어떻게 평가해야 하는가?”로 초점 변화. 제품 관리자(PM)처럼 문제를 정의하고 지표를 세울 줄 아는 역량이 중요
3. 후반전의 과제
“좋은 모델”을 넘어서 “좋은 문제 설정과 평가”가 AI 진화의 열쇠. 평가 지표가 부실하면 AI 진보도 왜곡. 앞으로는 AI 연구자가 아닌 ‘문제 설계자’로서의 사고 전환 필요
https://ysymyth.github.io/The-Second-Half/
ysymyth.github.io
The Second Half
tldr: We’re at AI’s halftime.
👍4
NATO, 팔란티어 AI 전투 시스템 도입
: NATO 통신정보국과 협력해 Maven 기반 맞춤형 Maven Smart System(MSS) NATO 인수 마무리
: 생성 AI, ML, LLM을 활용해 정보 융합, 표적 식별, 전장 인식 및 작전 계획 지원. 지휘관의 신속한 의사결정을 도움
: 계약은 6개월 만에 체결된 것으로 NATO 역사상 가장 신속한 계약 중 하나. 시스템은 30일 이내에 실제 작전 투입 예정
https://shape.nato.int/news-releases/nato-acquires-aienabled-warfighting-system-
: NATO 통신정보국과 협력해 Maven 기반 맞춤형 Maven Smart System(MSS) NATO 인수 마무리
: 생성 AI, ML, LLM을 활용해 정보 융합, 표적 식별, 전장 인식 및 작전 계획 지원. 지휘관의 신속한 의사결정을 도움
: 계약은 6개월 만에 체결된 것으로 NATO 역사상 가장 신속한 계약 중 하나. 시스템은 30일 이내에 실제 작전 투입 예정
https://shape.nato.int/news-releases/nato-acquires-aienabled-warfighting-system-
shape.nato.int
NATO acquires AI-enabled Warfighting System
SHAPE is responsible for planning and execution of all NATO operations and Allied Command Transformation (ACT) responsible for NATO's transformation.
👍4
오픈AI, GPT-4.1 시리즈 발표
: GPT‑4.1, GPT‑4.1 Mini, GPT‑4.1 nano 모델로 구성. 챗GPT에서는 사용할 수 없고 API로만 제공
: 코딩 성능 강화, 최대 100만 토큰 컨텍스트 윈도우, 멀티 모달 이해력 항샹, 비용 효율성(4o 대비 26% 저렴), 24년 6월 학습 컷 오프
: GPT-4.1 - 고성능 모델. 복잡한 코딩 및 문서 분석 적합
: GPT-4.1 mini - GPT-4o와 유사한 성능 빠른 응답과 저비용. 4o 대비 83% 저렴
: GPT-4.1 nano - 가장 빠르고 저렴한 모델. 분류, 자동완성 등 초고속 및 저비용 중요 작업 적합
: API 가격
- 4.1, 인풋 $2 및 아웃풋 $8
- 4.1 mini, 인풋 $0.4 및 아웃풋 $1.6
- 4.1 nano, 인풋 $0.1 및 아웃풋 $0.4
: GPT-4.5는 7/14일부로 API 중단 예정
https://openai.com/index/gpt-4-1/
: GPT‑4.1, GPT‑4.1 Mini, GPT‑4.1 nano 모델로 구성. 챗GPT에서는 사용할 수 없고 API로만 제공
: 코딩 성능 강화, 최대 100만 토큰 컨텍스트 윈도우, 멀티 모달 이해력 항샹, 비용 효율성(4o 대비 26% 저렴), 24년 6월 학습 컷 오프
: GPT-4.1 - 고성능 모델. 복잡한 코딩 및 문서 분석 적합
: GPT-4.1 mini - GPT-4o와 유사한 성능 빠른 응답과 저비용. 4o 대비 83% 저렴
: GPT-4.1 nano - 가장 빠르고 저렴한 모델. 분류, 자동완성 등 초고속 및 저비용 중요 작업 적합
: API 가격
- 4.1, 인풋 $2 및 아웃풋 $8
- 4.1 mini, 인풋 $0.4 및 아웃풋 $1.6
- 4.1 nano, 인풋 $0.1 및 아웃풋 $0.4
: GPT-4.5는 7/14일부로 API 중단 예정
https://openai.com/index/gpt-4-1/
OpenAI
Introducing GPT-4.1 in the API
Introducing GPT-4.1 in the API—a new family of models with across-the-board improvements, including major gains in coding, instruction following, and long-context understanding. We’re also releasing our first nano model. Available to developers worldwide…
👍1
[삼성 이영진] 글로벌 AI/SW
오픈AI, GPT-4.1 시리즈 발표 : GPT‑4.1, GPT‑4.1 Mini, GPT‑4.1 nano 모델로 구성. 챗GPT에서는 사용할 수 없고 API로만 제공 : 코딩 성능 강화, 최대 100만 토큰 컨텍스트 윈도우, 멀티 모달 이해력 항샹, 비용 효율성(4o 대비 26% 저렴), 24년 6월 학습 컷 오프 : GPT-4.1 - 고성능 모델. 복잡한 코딩 및 문서 분석 적합 : GPT-4.1 mini - GPT-4o와 유사한 성능 빠른 응답과…
오픈AI GPT-4.1 시리즈 API 가격과 주요 벤치마크
👍1