xAI, 논란의 모델 Grok 4 발표 - 엇갈리는 반응, 어떻게 봐야할까
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
일론 머스크가 이끄는 xAI가 버전 업 모델 Grok 4를 발표했습니다. 벤치마크 기준으로 높은 성능을 달성했으나, 반대로 실제 사용감이 아쉽다는 의견도 있는데요
머스크는 발표에서 슈퍼 휴먼 레벨로 Reasoning이 가능하고, 학부생 수준을 넘어 모든 분야에서 박사급 이상의 성능이라는 코멘트를 했습니다. 지능 폭발(Intelligence Explosion)의 시작점이라는 것인데요
여러 벤치마크에서 SOTA 성능을 보여줬고, 특히 수학 및 과학(STEM) 분야에서 높은 점수를 달성한 것은 사실입니다. AIME 2025는 100%를 달성하기도 했네요.
수학 및 물리 문제 해결에서는 극한의 정확도와 높은 문제 인식 능력, 오류 수정 및 다중 해석 가능을 강조했습니다.
물론 높은 벤치마크 달성을 위해 과적합 학습 진행을 했을 것이라는 의견도 있고, 툴 활용에 집착하는 모습도 높은 벤치마크 달성을 위해 짜여진 것이 아닌가하는 의문이 들지만,
현 시점 가장 지능이 높은 AI 모델인 것은 맞습니다. HLE(Humanity's Last Exam)나 ARG-AGI 같은 벤치마크까지 레벨업에 성공했으니까요
높은 벤치마크에 비해 체감되는 성능이 아쉽다는 이야기가 나오는 것은 완성형 모델이 아니기 때문이라고 판단합니다.
강화학습 일반화를 고려해 수학이랑 과학을 열심히 학습했고, 결과로 해당 분야에서 엄청난 고수가 되었지만, 코딩, 글쓰기, 이미지 이해 등 다른 분야 성능이 아직 부족한 상황입니다.
부족한 부분을 채우기 위해 향후 코딩 모델, 멀티 모달 에이전트, 영상 생성 모델 등 업데이트를 시사했습니다
'Grok 4의 핵심 대상은 높은 IQ를 지닌 사람'이라는 일반인을 까는 듯한 의견도 나왔지만, Grok 4 성능을 극한으로 끌어낼 수 있는 질문(ex 책과 인터넷에 없는 재료과학 문제)을 던지기 어렵다는 것을 의미하기도 합니다
(그래도 일반인으로서 불편하긴 하네요..)
현재 버전 Grok 4의 쓰임은 수학 물리 과학 문제 측면 활용입니다. 실제로 머스크는 올해 말 이후 새로운 유용한 기술을 발견하고, 내년에는 새로운 물리 법칙의 발견을 기대 한다는 코멘트를 남겼습니다.
이를 위한 물리 세계와의 상호작용을 강조하며, Grok과 옵티머스의 결합이 진정한 혁신이라고 주장했습니다.
또한 Grok 4의 주요 특징은 보이스 모드 개선입니다. 레이턴시가 감소되었고, 부드러운 대화가 가능하며, 목소리도 추가되었습니다.
타사 챗 봇의 보이스 모드와 직접 비교하는 시연까지하며 자신감을 보여줬는데요. 늦어도 다음 주에는 테슬라 차량에 탑재될 것이라는 포스팅을 남기며 기대감도 높혔습니다.
전체 AI 산업 발전 관점에서 Grok 4가 보여준 주요 의미는 추론 스케일링 강화를 통한 모델 성능 향상이 아직도 가능하다는 것을 증명한 것입니다.
Grok 2 → 3에는 사전 학습 사용 컴퓨팅 자원이 10배 증가했지만, Grok 3 → 4는 강화학습에 컴퓨팅 자원이 추가로 10배 증가했습니다.(Grok 2 → 4는 100배). 20만개 GPU의 Colossus 클러스터가 기반입니다.
또한 Grok 4 Heavy와 같은 멀티 에이전트 처리 시스템을 보여준 것도 유의미한 발전 방향성입니다.
Grok 4는 경쟁의 끝이 아니라 또 다른 Phase의 시작입니다. 오픈AI의 GPT-5와 구글의 Gemini 3.0도 가까워지고 있습니다. 추가 업데이트해 드리겠습니다.
(2025/7/11 공표자료)
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
일론 머스크가 이끄는 xAI가 버전 업 모델 Grok 4를 발표했습니다. 벤치마크 기준으로 높은 성능을 달성했으나, 반대로 실제 사용감이 아쉽다는 의견도 있는데요
머스크는 발표에서 슈퍼 휴먼 레벨로 Reasoning이 가능하고, 학부생 수준을 넘어 모든 분야에서 박사급 이상의 성능이라는 코멘트를 했습니다. 지능 폭발(Intelligence Explosion)의 시작점이라는 것인데요
여러 벤치마크에서 SOTA 성능을 보여줬고, 특히 수학 및 과학(STEM) 분야에서 높은 점수를 달성한 것은 사실입니다. AIME 2025는 100%를 달성하기도 했네요.
수학 및 물리 문제 해결에서는 극한의 정확도와 높은 문제 인식 능력, 오류 수정 및 다중 해석 가능을 강조했습니다.
물론 높은 벤치마크 달성을 위해 과적합 학습 진행을 했을 것이라는 의견도 있고, 툴 활용에 집착하는 모습도 높은 벤치마크 달성을 위해 짜여진 것이 아닌가하는 의문이 들지만,
현 시점 가장 지능이 높은 AI 모델인 것은 맞습니다. HLE(Humanity's Last Exam)나 ARG-AGI 같은 벤치마크까지 레벨업에 성공했으니까요
높은 벤치마크에 비해 체감되는 성능이 아쉽다는 이야기가 나오는 것은 완성형 모델이 아니기 때문이라고 판단합니다.
강화학습 일반화를 고려해 수학이랑 과학을 열심히 학습했고, 결과로 해당 분야에서 엄청난 고수가 되었지만, 코딩, 글쓰기, 이미지 이해 등 다른 분야 성능이 아직 부족한 상황입니다.
부족한 부분을 채우기 위해 향후 코딩 모델, 멀티 모달 에이전트, 영상 생성 모델 등 업데이트를 시사했습니다
'Grok 4의 핵심 대상은 높은 IQ를 지닌 사람'이라는 일반인을 까는 듯한 의견도 나왔지만, Grok 4 성능을 극한으로 끌어낼 수 있는 질문(ex 책과 인터넷에 없는 재료과학 문제)을 던지기 어렵다는 것을 의미하기도 합니다
(그래도 일반인으로서 불편하긴 하네요..)
현재 버전 Grok 4의 쓰임은 수학 물리 과학 문제 측면 활용입니다. 실제로 머스크는 올해 말 이후 새로운 유용한 기술을 발견하고, 내년에는 새로운 물리 법칙의 발견을 기대 한다는 코멘트를 남겼습니다.
이를 위한 물리 세계와의 상호작용을 강조하며, Grok과 옵티머스의 결합이 진정한 혁신이라고 주장했습니다.
또한 Grok 4의 주요 특징은 보이스 모드 개선입니다. 레이턴시가 감소되었고, 부드러운 대화가 가능하며, 목소리도 추가되었습니다.
타사 챗 봇의 보이스 모드와 직접 비교하는 시연까지하며 자신감을 보여줬는데요. 늦어도 다음 주에는 테슬라 차량에 탑재될 것이라는 포스팅을 남기며 기대감도 높혔습니다.
전체 AI 산업 발전 관점에서 Grok 4가 보여준 주요 의미는 추론 스케일링 강화를 통한 모델 성능 향상이 아직도 가능하다는 것을 증명한 것입니다.
Grok 2 → 3에는 사전 학습 사용 컴퓨팅 자원이 10배 증가했지만, Grok 3 → 4는 강화학습에 컴퓨팅 자원이 추가로 10배 증가했습니다.(Grok 2 → 4는 100배). 20만개 GPU의 Colossus 클러스터가 기반입니다.
또한 Grok 4 Heavy와 같은 멀티 에이전트 처리 시스템을 보여준 것도 유의미한 발전 방향성입니다.
Grok 4는 경쟁의 끝이 아니라 또 다른 Phase의 시작입니다. 오픈AI의 GPT-5와 구글의 Gemini 3.0도 가까워지고 있습니다. 추가 업데이트해 드리겠습니다.
(2025/7/11 공표자료)
👍3❤1
글로벌 소프트웨어 섹터 점검, 전일 조정의 이유는?
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
전일 글로벌 소프트웨어 섹터 내 전방위적 조정이 나타났습니다. IGV ETF 기준으로도 2% 하락했는데요
팔란티어와 오라클이 TP 상향에 따라 상대적인 방어에 성공했을 뿐
- Saas(CRM -2.6%, NOW -4.5%, WDAY -4.5%),
- 사이버보안(PANW -6.8%, FTNT -6.9%, CRWD -5.1%, NET -6.0%),
- 데이터 & 옵저버빌리티(SNOW -3.4%, MDB -3.6%, DDOG -3.7%)
모두에서 낙폭이 상당했습니다.
소프트웨어 내 특정 섹터에 국한된 흐름도 아니고 관련한 특별한 뉴스 플로우도 부재한 상황입니다.
생각해볼 수 있는 것은 업종 순환매입니다. 테크에서 경기민감주로, 테크 내에서도 소프트웨어에서 반도체로 전환입니다.
엔비디아가 시총 4조 달러의 벽을 처음으로 넘으면서 필라델피아 반도체 지수는 3일 연속 상승하는 모습을 보여주고 있으니까요(역시 반도체인가?!)
반도체와 소프트웨어 섹터(상위 40개 기업 기준) 흐름을 비교해보면 소프트웨어는 24년 상반기 부진 이후 하반기에는 반도체 섹터를 크게 아웃퍼폼하기 시작했고, 25년 들어서도 3.4월 긍정적 흐름을 보여줬습니다.
하지만 관세 관련 조정에서 회복하는 구간에서 상대적으로 덜 빠지고 이후 덜 오르는 모습을 보여줬고, 6월 수익률 +3.6%로 반도체(+16.6%)대비 13%p 언더퍼폼했습니다. 보합권에서 스멀스멀 올라가는 모습을 보여주긴 했지만, 월간 수익률로는 24년 이후 최대 격차입니다.
순환매가 언제까지 이어질지 예측할 수는 없습니다. 이런 흐름의 기저에는 소프트웨어 기업이 밸류에이션이 높았다는 점도 영향을 미치니까요.
하지만 확실한 것은 펀더멘털적으로 변화한 것은 없다는 것입니다. 또한 매크로 관련 가이던스 부진이 대두된 C1Q24 시즌과 비교하기에는 관련 우려가 다시 대두될 가능성도 제한적입니다. 당시 부재했던 AI 수익화 모멘텀도 이제는 가시화되고 있습니다.
7월 중순 이후 실적 시즌에 돌입하며 성과 확인이 진행된다면 현재의 애매한 느낌도 상당 부분 해소될 수 있을 것이라 판단합니다.
그럼에도 단기 변동성조차도 피하고 싶다면 마이크로소프트, 오라클과 같은 클라우드 인프라 기업이나 팔란티어처럼 실적 개선에 의구심이 없는 기업을 고려해 볼 수 있습니다.
(2025/7/11 공표자료)
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
전일 글로벌 소프트웨어 섹터 내 전방위적 조정이 나타났습니다. IGV ETF 기준으로도 2% 하락했는데요
팔란티어와 오라클이 TP 상향에 따라 상대적인 방어에 성공했을 뿐
- Saas(CRM -2.6%, NOW -4.5%, WDAY -4.5%),
- 사이버보안(PANW -6.8%, FTNT -6.9%, CRWD -5.1%, NET -6.0%),
- 데이터 & 옵저버빌리티(SNOW -3.4%, MDB -3.6%, DDOG -3.7%)
모두에서 낙폭이 상당했습니다.
소프트웨어 내 특정 섹터에 국한된 흐름도 아니고 관련한 특별한 뉴스 플로우도 부재한 상황입니다.
생각해볼 수 있는 것은 업종 순환매입니다. 테크에서 경기민감주로, 테크 내에서도 소프트웨어에서 반도체로 전환입니다.
엔비디아가 시총 4조 달러의 벽을 처음으로 넘으면서 필라델피아 반도체 지수는 3일 연속 상승하는 모습을 보여주고 있으니까요(역시 반도체인가?!)
반도체와 소프트웨어 섹터(상위 40개 기업 기준) 흐름을 비교해보면 소프트웨어는 24년 상반기 부진 이후 하반기에는 반도체 섹터를 크게 아웃퍼폼하기 시작했고, 25년 들어서도 3.4월 긍정적 흐름을 보여줬습니다.
하지만 관세 관련 조정에서 회복하는 구간에서 상대적으로 덜 빠지고 이후 덜 오르는 모습을 보여줬고, 6월 수익률 +3.6%로 반도체(+16.6%)대비 13%p 언더퍼폼했습니다. 보합권에서 스멀스멀 올라가는 모습을 보여주긴 했지만, 월간 수익률로는 24년 이후 최대 격차입니다.
순환매가 언제까지 이어질지 예측할 수는 없습니다. 이런 흐름의 기저에는 소프트웨어 기업이 밸류에이션이 높았다는 점도 영향을 미치니까요.
하지만 확실한 것은 펀더멘털적으로 변화한 것은 없다는 것입니다. 또한 매크로 관련 가이던스 부진이 대두된 C1Q24 시즌과 비교하기에는 관련 우려가 다시 대두될 가능성도 제한적입니다. 당시 부재했던 AI 수익화 모멘텀도 이제는 가시화되고 있습니다.
7월 중순 이후 실적 시즌에 돌입하며 성과 확인이 진행된다면 현재의 애매한 느낌도 상당 부분 해소될 수 있을 것이라 판단합니다.
그럼에도 단기 변동성조차도 피하고 싶다면 마이크로소프트, 오라클과 같은 클라우드 인프라 기업이나 팔란티어처럼 실적 개선에 의구심이 없는 기업을 고려해 볼 수 있습니다.
(2025/7/11 공표자료)
❤3👍1
구글, 연방 정부 대상 클라우드 컴퓨팅 서비스 가격 인하 제공
: 트럼프 행정부의 IT 조달 비용 절감 정책 추진 영향. GSA(연방 조달청)을 통해 정부 기관을 하나의 고객으로 간주하고 할인 제공
: 오라클은 지난주 라이선스 소프트웨어 계약에 대한 75% 할인(11월까지)와 클라우드 컴퓨팅 전반의 대폭 할인 제공 합의
: 마이크로소프트(Azure)와 아마존(AWS)도 유사한 할인 요구를 받는 상황
: 구글은 4월 워크스페이스 계약에 대해 71% 가격 인하 합의(9월까지) 이외에 어도비와 세일즈포스(슬랙)도 정부향 소프트웨어 할인 발표
: 트럼프 행정부의 IT 조달 비용 절감 정책 추진 영향. GSA(연방 조달청)을 통해 정부 기관을 하나의 고객으로 간주하고 할인 제공
: 오라클은 지난주 라이선스 소프트웨어 계약에 대한 75% 할인(11월까지)와 클라우드 컴퓨팅 전반의 대폭 할인 제공 합의
: 마이크로소프트(Azure)와 아마존(AWS)도 유사한 할인 요구를 받는 상황
: 구글은 4월 워크스페이스 계약에 대해 71% 가격 인하 합의(9월까지) 이외에 어도비와 세일즈포스(슬랙)도 정부향 소프트웨어 할인 발표
👍3
xAI, 1,700~2,000억 달러 밸류로 펀딩 논의 보도
: 사우디 PIF 국부 펀드가 주요 투자자로 거론
: 최근 50억 달러의 부채 금융과 50억 달러 지분 투자 확보
: 머스크는 xAI는 충분한 자본이 있고, 당장 자금 조달을 추진하지 않는다고 판박
■ xAI 밸류에이션 추이
24년 5월 - 240억 달러 - 시리즈 B, 60억 달러 조달
24년 12월 - 500억 달러 수준 - 시리즈 C, 60억 달러
25년 3월 - 800억 달러 - X 인수(X 밸류 330억 달러)
25년 6월 - 1,130억 달러 - 구주 매출, 3억 달러
: 사우디 PIF 국부 펀드가 주요 투자자로 거론
: 최근 50억 달러의 부채 금융과 50억 달러 지분 투자 확보
: 머스크는 xAI는 충분한 자본이 있고, 당장 자금 조달을 추진하지 않는다고 판박
■ xAI 밸류에이션 추이
24년 5월 - 240억 달러 - 시리즈 B, 60억 달러 조달
24년 12월 - 500억 달러 수준 - 시리즈 C, 60억 달러
25년 3월 - 800억 달러 - X 인수(X 밸류 330억 달러)
25년 6월 - 1,130억 달러 - 구주 매출, 3억 달러
👍3
오픈AI의 Windsurf 인수 무산 → 구글 딥마인드로 핵심 인력 합류
: CEO Varun Mohan, 공동 창업자 Douglas Chen 및 R&D 핵심 인력이 구글 딥마인드로 이동
: 구글-캐릭터 AI(노암 샤지어 영입)나 MS-인플렉션(무스타파 슐레이만 영입) 딜과 유사한 형태
: 구글은 Windsurf 기술에 대한 비독점 라이선스 확보. 지분 인수 X. 에이전틱 코딩 강화 기대감
: MS-오픈AI 간 협상에서 Windsurf IP 활용 여부에 대한 이견이 있었다는 보도가 있었음
: Windsurf는 잔류 인력 중심으로 기업용 AI 코딩 솔루션 개발에 집중 예정
: CEO Varun Mohan, 공동 창업자 Douglas Chen 및 R&D 핵심 인력이 구글 딥마인드로 이동
: 구글-캐릭터 AI(노암 샤지어 영입)나 MS-인플렉션(무스타파 슐레이만 영입) 딜과 유사한 형태
: 구글은 Windsurf 기술에 대한 비독점 라이선스 확보. 지분 인수 X. 에이전틱 코딩 강화 기대감
: MS-오픈AI 간 협상에서 Windsurf IP 활용 여부에 대한 이견이 있었다는 보도가 있었음
: Windsurf는 잔류 인력 중심으로 기업용 AI 코딩 솔루션 개발에 집중 예정
❤4👍1
[삼성 이영진] 글로벌 AI/SW
오픈AI의 Windsurf 인수 무산 → 구글 딥마인드로 핵심 인력 합류 : CEO Varun Mohan, 공동 창업자 Douglas Chen 및 R&D 핵심 인력이 구글 딥마인드로 이동 : 구글-캐릭터 AI(노암 샤지어 영입)나 MS-인플렉션(무스타파 슐레이만 영입) 딜과 유사한 형태 : 구글은 Windsurf 기술에 대한 비독점 라이선스 확보. 지분 인수 X. 에이전틱 코딩 강화 기대감 : MS-오픈AI 간 협상에서 Windsurf IP 활용…
구글-windsurf 딜 금액은 24억 달러. 오픈AI가 논의하던 인수 금액은 30억 달러
👍4
[삼성 이영진] 글로벌 AI/SW 헤드라인 (25/7/14)
■ 오픈AI Windsurf 인수 무산. 구글 딥마인드로 Windsurf 핵심 인력 합류. 구글은 Windsurf 기술에 대한 비독점 라이선스 확보. 딜 규모는 24억 달러
■ 오픈AI, 다음 주 예정이던 오픈 웨이트 모델 출시 연기. 추가 안전성 테스트와 고위험 영역 검토 필요 입장
■ xAI, 챗 봇 Grok의 반유대주의적 및 히틀러 찬양 발언 사건에 대해 공식 사과. 파운데이션 모델과는 관계가 없고 코드 업데이트 문제라는 입장
■ xAI, 1,700~2,000억 달러 밸류로 펀딩 논의 보도
■ 스페이스X, xAI에 20억 달러 투자 보도. 50억 달러 지분 투자의 일부
■ 애플, 프랑스 미스트랄 AI 인수 고려 보도
■ 메타, 오픈AI에서 멀티모달 AI를 담당하던 앨런 자브리와 루 리우 영입
■ 메타, 음성 AI 스타트업 PlayAI 인수. 팀원 전원이 MSL로 합류
■ 구글, 연방 정부 대상 클라우드 컴퓨팅 서비스 가격 인하 제공
■ AWS, ML, AI 모델 학습 및 추론 플랫폼 SageMaker 업데이트. 옵저버빌리티 기능, 연결형 IDE 환경, GPU 클러스터 성능 관리 등
■ 세일즈포스, GUI 에이전트. GTA1 관련 논문 게재
■ Manus, 중국 SNS 계정 삭제 및 중국 지역 내 홈페이지 접속 불가. 핵심 기술 인력의 싱가포르 본사 이동 및 인력 조정에 따른 중국 철수설 부각
감사합니다.
■ 오픈AI Windsurf 인수 무산. 구글 딥마인드로 Windsurf 핵심 인력 합류. 구글은 Windsurf 기술에 대한 비독점 라이선스 확보. 딜 규모는 24억 달러
■ 오픈AI, 다음 주 예정이던 오픈 웨이트 모델 출시 연기. 추가 안전성 테스트와 고위험 영역 검토 필요 입장
■ xAI, 챗 봇 Grok의 반유대주의적 및 히틀러 찬양 발언 사건에 대해 공식 사과. 파운데이션 모델과는 관계가 없고 코드 업데이트 문제라는 입장
■ xAI, 1,700~2,000억 달러 밸류로 펀딩 논의 보도
■ 스페이스X, xAI에 20억 달러 투자 보도. 50억 달러 지분 투자의 일부
■ 애플, 프랑스 미스트랄 AI 인수 고려 보도
■ 메타, 오픈AI에서 멀티모달 AI를 담당하던 앨런 자브리와 루 리우 영입
■ 메타, 음성 AI 스타트업 PlayAI 인수. 팀원 전원이 MSL로 합류
■ 구글, 연방 정부 대상 클라우드 컴퓨팅 서비스 가격 인하 제공
■ AWS, ML, AI 모델 학습 및 추론 플랫폼 SageMaker 업데이트. 옵저버빌리티 기능, 연결형 IDE 환경, GPU 클러스터 성능 관리 등
■ 세일즈포스, GUI 에이전트. GTA1 관련 논문 게재
■ Manus, 중국 SNS 계정 삭제 및 중국 지역 내 홈페이지 접속 불가. 핵심 기술 인력의 싱가포르 본사 이동 및 인력 조정에 따른 중국 철수설 부각
감사합니다.
👍2❤1
xAI, Grok 챗봇 논란과 AI의 지향점
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
5월에 이어 다시 이슈가 된 챗봇 Grok의 반유대주의 및 히틀러 찬양 발언에 대해 xAI가 공식 사과했습니다.
이슈를 점검해보면 문제는 Grok 언어 모델 자체가 아니라, Grok 챗봇의 작동 및 응답 관련 핵심 규칙과 명령어 모음 세트의 복원 코드 경로 업데이트에서 발생했다고 언급했습니다.
코드 변경으로 인해 폐기된 명령어 집합이 예기치 않게 적용되었고, Grok이 유저 게시물을 해석하는 방식이 왜곡 되어 기존 X 내 극단주의적 게시물에도 반응한 것인데요
Grok의 응답 스타일을 극단적이고 편향된 방식으로 유도할 수 있는 문제가 된 주요 명렁어는
"직설적으로 말하고, 정치적 올바름에 얽매이지 않을 것" "게시물의 어조, 맥락, 언어를 이해하고 반영할 것" "사람처럼 대답하고, 게시물 내용을 반복하지 말고 흥미롭게 대답할 것" 입니다.
사실성, 안정성 등 핵심 원칙을 무시하고, 사용자 맞춤 과잉 반응하거나, 유저의 이전 발화의 편향성을 증폭하고, 무조건적 모방에 따라 혐오 표현 등 부적절한 콘텐츠를 비판적 판단 없이 따라하는 결과로 이어졌습니다.
해당 업데이트는 16시간 활성화되어 있었는데요, xAI는 남용 사례 급증에 따라 X 플랫폼 내 @grok 기능을 비활성화 후, 문제가 된 명령어 세트 전체를 제거하고 전체 시스템 리팩토링을 진행해 악용 가능성을 제거하는 방식으로 대응했습니다.
새롭게 설정된 시스템 프롬프트를 Grok의 깃허브 공개 리포지토리에 게시하는 방식과 함께 모니터링 및 배포 절차 강화로 투명성을 더하려는 노력도 진행하고 있네요
추가로 머스크는 극단적 편향을 모두 피하는게 놀라울 정도로 어렵다는 의견과 함께 해결책으로 V7 파운데이션 모델은 전체 인터넷이 아닌 선별된 데이터 기반으로 학습시키고 있으며, Grok 4가 매일매일 조금씩 개선되고 있다는 코멘트를 남겼습니다.
하지만 Grok 4 Heavy에 성(Sur name)을 반환하라는 명령어에 히틀러(Hitler)를 반복하는 영상이 X에 확산되며 논란은 지속되고 있네요
이번에 나온 Grok 4의 성능은 개선되었지만, STEM 분야에 포커싱되어 글쓰기나 코딩에서는 아쉽다는 평가를 받고 있습니다.
여기에 단 몇 줄의 명령어로 인해 응답 방향이 극단적으로 왜곡되었고, 거버넌스 및 내부 통제에 실패한 사례가 발생한 것은 신뢰도 측면에서 문제입니다.
AI가 완벽하지 않다는 것은 이미 알고 있는 내용이지만, 사소한 답변을 잘못하는 것과 극단적 답변을 내놓는 것은 또 다른 차원의 문제니까요
향후에는 AI 시스템은 단순히 빠르고 정확하다는 것을 넘어 예측 가능하고 책임있는 행동의 일관성을 보장할 수 있는지 여부가 주요한 척도가 될 것입니다.
(2025/7/14 공표자료)
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
5월에 이어 다시 이슈가 된 챗봇 Grok의 반유대주의 및 히틀러 찬양 발언에 대해 xAI가 공식 사과했습니다.
이슈를 점검해보면 문제는 Grok 언어 모델 자체가 아니라, Grok 챗봇의 작동 및 응답 관련 핵심 규칙과 명령어 모음 세트의 복원 코드 경로 업데이트에서 발생했다고 언급했습니다.
코드 변경으로 인해 폐기된 명령어 집합이 예기치 않게 적용되었고, Grok이 유저 게시물을 해석하는 방식이 왜곡 되어 기존 X 내 극단주의적 게시물에도 반응한 것인데요
Grok의 응답 스타일을 극단적이고 편향된 방식으로 유도할 수 있는 문제가 된 주요 명렁어는
"직설적으로 말하고, 정치적 올바름에 얽매이지 않을 것" "게시물의 어조, 맥락, 언어를 이해하고 반영할 것" "사람처럼 대답하고, 게시물 내용을 반복하지 말고 흥미롭게 대답할 것" 입니다.
사실성, 안정성 등 핵심 원칙을 무시하고, 사용자 맞춤 과잉 반응하거나, 유저의 이전 발화의 편향성을 증폭하고, 무조건적 모방에 따라 혐오 표현 등 부적절한 콘텐츠를 비판적 판단 없이 따라하는 결과로 이어졌습니다.
해당 업데이트는 16시간 활성화되어 있었는데요, xAI는 남용 사례 급증에 따라 X 플랫폼 내 @grok 기능을 비활성화 후, 문제가 된 명령어 세트 전체를 제거하고 전체 시스템 리팩토링을 진행해 악용 가능성을 제거하는 방식으로 대응했습니다.
새롭게 설정된 시스템 프롬프트를 Grok의 깃허브 공개 리포지토리에 게시하는 방식과 함께 모니터링 및 배포 절차 강화로 투명성을 더하려는 노력도 진행하고 있네요
추가로 머스크는 극단적 편향을 모두 피하는게 놀라울 정도로 어렵다는 의견과 함께 해결책으로 V7 파운데이션 모델은 전체 인터넷이 아닌 선별된 데이터 기반으로 학습시키고 있으며, Grok 4가 매일매일 조금씩 개선되고 있다는 코멘트를 남겼습니다.
하지만 Grok 4 Heavy에 성(Sur name)을 반환하라는 명령어에 히틀러(Hitler)를 반복하는 영상이 X에 확산되며 논란은 지속되고 있네요
이번에 나온 Grok 4의 성능은 개선되었지만, STEM 분야에 포커싱되어 글쓰기나 코딩에서는 아쉽다는 평가를 받고 있습니다.
여기에 단 몇 줄의 명령어로 인해 응답 방향이 극단적으로 왜곡되었고, 거버넌스 및 내부 통제에 실패한 사례가 발생한 것은 신뢰도 측면에서 문제입니다.
AI가 완벽하지 않다는 것은 이미 알고 있는 내용이지만, 사소한 답변을 잘못하는 것과 극단적 답변을 내놓는 것은 또 다른 차원의 문제니까요
향후에는 AI 시스템은 단순히 빠르고 정확하다는 것을 넘어 예측 가능하고 책임있는 행동의 일관성을 보장할 수 있는지 여부가 주요한 척도가 될 것입니다.
(2025/7/14 공표자료)
❤3👍1
오픈AI는 위기인가? 수많은 이슈 점검해 보기
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
오픈AI를 둘러싼 다양한 뉴스 플로우가 나오며 위기설까지 대두되고 있습니다. 우선 주요 이슈 2가지는 안 좋은 소식은 맞습니다.
■ Windsurf(윈드서프) 인수 실패와 MS와 갈등
30억 달러 규모 인수 이야기가 나왔던 윈드서프 인수가 최종 기한을 넘기며 무산되었고, 구글이 틈을 노려 24억 달러에 CEO와 공동 창업자 및 R&D 인력을 영입했습니다. 구글은 윈드서프 기술에 대한 비독점 라이선스를 확보하게 됩니다.
MS-오픈AI 간 영리법인 전환 협상에서 윈드서프 IP 활용 여부에 대한 이견이 있었다는 보도가 있었던만큼 내용이 사실이라면 MS가 이를 저지한 격이 되었습니다.
단기적으로 AI 코딩 분야 확장을 통한 에이전트 구축 관련 계획에 차질이 생기는 것뿐 아니라, 향후 인수에도 유사한 이슈가 대두될 수 있다는 우려가 있습니다.
■ 오픈 웨이트 모델 출시 연기
샘 올트먼은 이번 주 예정이었던 오픈 웨이트 모델 출시 계획 연기를 발표했습니다. 추가적 안정성 테스트와 고위험 영역 검토에 시간이 필요하다는 입장입니다.
공교롭게 직전에 중국의 문샷 ai가 Kimi K2라는 상당한 성능의 오픈소스 모델을 공개하며 지연의 이유로 지목되기도 했습니다.
오픈AI 직원이 오픈 웨이트 모델 출시 연기 이유로 "오픈소스 모델에 대한 기준이 높고, 모든 측면에서 자랑스러운 모델을 내놓기 위함"이라는 내용을 언급하기도 했으니까요
물론 연기가 진짜 안전 문제와 관련된 것이고, 재학습이 필요하다는 외부 서드파티 관계자 발언도 있었습니다. 하지만 안전 문제가 발생했다면 그것대로 문제입니다. 모델 출시 연기라는 결과가 바뀌지는 않으니까요
물론 그 외 언급되는 내용들은 위기설을 위해 영끌한 느낌이 있습니다.
우선 메타 발 인재 영입 블랙홀에 따른 인력 유출과 리더십 이탈은 이미 알려진 사실입니다.
또한 GPT-5 지연은 아직 구체적으로 확정된 소식은 아닙니다. 올 여름 출시라는 타임라인에서 아직 벗어나진 않았으니까요
밸류에이션 하락은 추가 확인이 필요한 부분이지만, 매출 대비 밸류에이션을 고려하면 앤스로픽이나 xAI 대비 오픈AI의 밸류가 그렇게 높은 편은 아닙니다.
현금 소진도 AI 스타트업은 모두 경험하고 있는 이슈입니다. 대표적으로 xAI의 자금 조달 소식이 이어지고 있습니다. 오히려 오픈AI는 매출이 일정 수준 발생하는 상황이기 때문에 장사가 잘되는 것의 반증이기도 합니다.
소프트뱅크 투자 내용도 영리법인 전환 관련 이슈입니다. 400억 달러(소뱅 300억 달러+외부 100억 달러) 투자에서 오픈AI가 영리법인 전환에 실패할 경우 전체 규모가 200억 달러로 축소된다는 것인데요.
다만 100억 달러는 조달되었고, 손정의 의장은 최근 주주총회에서 여전히 오픈AI 투자에 대한 강한 확신을 보여줬습니다.
25년들어 경쟁 AI 기업의 빠른 성장에 주도권을 상당 부분 내어주고 있지만, 아직까지 선두 그룹에서 밀려났다고 볼 수는 없습니다.
다만 GPT-5의 중요성이 더욱 높아지게 됩니다. Grok 4보다는 구글이 갈고있는 Gemini 3.0과의 진검 승부에 주목해야 합니다.
MS 입장에서도 GPT-5의 중요성은 여전합니다. 갈등을 겪고 있지만 오픈AI가 침몰하는 것을 가만히 지켜보진 않을 텐데요. 연말까지 끌지 않고 빠른 갈등 봉합 소식이 중요합니다.
(2025/7/14 공표자료)
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
오픈AI를 둘러싼 다양한 뉴스 플로우가 나오며 위기설까지 대두되고 있습니다. 우선 주요 이슈 2가지는 안 좋은 소식은 맞습니다.
■ Windsurf(윈드서프) 인수 실패와 MS와 갈등
30억 달러 규모 인수 이야기가 나왔던 윈드서프 인수가 최종 기한을 넘기며 무산되었고, 구글이 틈을 노려 24억 달러에 CEO와 공동 창업자 및 R&D 인력을 영입했습니다. 구글은 윈드서프 기술에 대한 비독점 라이선스를 확보하게 됩니다.
MS-오픈AI 간 영리법인 전환 협상에서 윈드서프 IP 활용 여부에 대한 이견이 있었다는 보도가 있었던만큼 내용이 사실이라면 MS가 이를 저지한 격이 되었습니다.
단기적으로 AI 코딩 분야 확장을 통한 에이전트 구축 관련 계획에 차질이 생기는 것뿐 아니라, 향후 인수에도 유사한 이슈가 대두될 수 있다는 우려가 있습니다.
■ 오픈 웨이트 모델 출시 연기
샘 올트먼은 이번 주 예정이었던 오픈 웨이트 모델 출시 계획 연기를 발표했습니다. 추가적 안정성 테스트와 고위험 영역 검토에 시간이 필요하다는 입장입니다.
공교롭게 직전에 중국의 문샷 ai가 Kimi K2라는 상당한 성능의 오픈소스 모델을 공개하며 지연의 이유로 지목되기도 했습니다.
오픈AI 직원이 오픈 웨이트 모델 출시 연기 이유로 "오픈소스 모델에 대한 기준이 높고, 모든 측면에서 자랑스러운 모델을 내놓기 위함"이라는 내용을 언급하기도 했으니까요
물론 연기가 진짜 안전 문제와 관련된 것이고, 재학습이 필요하다는 외부 서드파티 관계자 발언도 있었습니다. 하지만 안전 문제가 발생했다면 그것대로 문제입니다. 모델 출시 연기라는 결과가 바뀌지는 않으니까요
물론 그 외 언급되는 내용들은 위기설을 위해 영끌한 느낌이 있습니다.
우선 메타 발 인재 영입 블랙홀에 따른 인력 유출과 리더십 이탈은 이미 알려진 사실입니다.
또한 GPT-5 지연은 아직 구체적으로 확정된 소식은 아닙니다. 올 여름 출시라는 타임라인에서 아직 벗어나진 않았으니까요
밸류에이션 하락은 추가 확인이 필요한 부분이지만, 매출 대비 밸류에이션을 고려하면 앤스로픽이나 xAI 대비 오픈AI의 밸류가 그렇게 높은 편은 아닙니다.
현금 소진도 AI 스타트업은 모두 경험하고 있는 이슈입니다. 대표적으로 xAI의 자금 조달 소식이 이어지고 있습니다. 오히려 오픈AI는 매출이 일정 수준 발생하는 상황이기 때문에 장사가 잘되는 것의 반증이기도 합니다.
소프트뱅크 투자 내용도 영리법인 전환 관련 이슈입니다. 400억 달러(소뱅 300억 달러+외부 100억 달러) 투자에서 오픈AI가 영리법인 전환에 실패할 경우 전체 규모가 200억 달러로 축소된다는 것인데요.
다만 100억 달러는 조달되었고, 손정의 의장은 최근 주주총회에서 여전히 오픈AI 투자에 대한 강한 확신을 보여줬습니다.
25년들어 경쟁 AI 기업의 빠른 성장에 주도권을 상당 부분 내어주고 있지만, 아직까지 선두 그룹에서 밀려났다고 볼 수는 없습니다.
다만 GPT-5의 중요성이 더욱 높아지게 됩니다. Grok 4보다는 구글이 갈고있는 Gemini 3.0과의 진검 승부에 주목해야 합니다.
MS 입장에서도 GPT-5의 중요성은 여전합니다. 갈등을 겪고 있지만 오픈AI가 침몰하는 것을 가만히 지켜보진 않을 텐데요. 연말까지 끌지 않고 빠른 갈등 봉합 소식이 중요합니다.
(2025/7/14 공표자료)
❤3👍1
중국의 문샷 ai가 보여준 진보 - Kimi K2와 MuonClip
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
주말간 AI 씬에 이슈가 많아 전달드리는 내용이 많은데요, 중국 AI의 유의미한 발전에서 주목할 내용이 있습니다. 바로 문샷 ai에서 오픈소스로 공개한 Kimi K2입니다.
Kimi K2는 파라미터 1조 개에 활성 파라미터 320억 개의 MoE 모델입니다. 연구 및 파인 튜닝용 kimi-K2-Base와 채팅 및 에이전트 작업에 최적화된 kimi-K2-Instruct로 구성되는데요(로컬 구동은 다소 어려운 사이즈지만..)
성능 면에서 기존 선두 추론 모델을 압도하지는 않지만, 오픈소스 모델 내 SOTA 지위를 부여할 수 있고, 저렴한 API 가격(인풋 $0.15(캐싱 o) 및 $0.6(캐싱 x), 아웃풋 $2.5/백만토큰)도 강점입니다.
모델 구조는 딥시크 V3와 유사하지만, 헤드(Head) 수 감소로 장문 컨텍스트 효율성을 향상시켰고, 활성 전문가가 증가했지만, 토큰 효율성을 극대화했습니다.
K2는 에이전트적 기능 강화를 통한 복잡한 작업 실행 능력도 보여주고 있는데요 급여 분석, 런던 콘서트 기획 등 시연에서는 실제 업무 실행이 가능한 AI 시스템으로 진화도 엿볼 수 있네요.
에이전트 능력은 1) 툴 사용 학습을 위한 대규모 에이전트형 합성 데이터 구축, 2) 범용 강화학습을 기반으로 합니다.
허깅페이스 내 트렌딩 1위에 오르고, 오픈라우터에서 xAI 점유율을 넘었으며, 후기 학습 진행 후 퍼플렉시티 탑재 예정이라는 점도 의미 있는 확산력을 보여줍니다.
기술적 측면에서 주목할 부분은 MuonClip 최적화 기법의 도입입니다.
문샷은 앞서 진행한 Moonlight 연구에서 Muon 옵티마이저가 서구 AI 기업이 주로 채택하는 AdamW 대비 뛰어난 성과를 낸다는 것을 확인했습니다.
다만 토큰 확장 과정에서 attention 매커니즘의 logit 폭주(쿼리(Q)와 키(K)의 숫자가 커져 곱한 결과(logit)도 커짐 → AI가 한 곳만 보고 다른 것은 무시)로 인한 학습 불완정성은 Muon 기반에서 더 자주 발생하는 경향을 보였습니다.
불안정성은 모델 학습의 숨겨진 비용입니다. 학습 실패에 따른 재시작 리스크뿐 아니라, 안정화를 위해 고비용 구조를 채택하거나, 성능을 일부 포기해야했으니까요
K2에는 이러한 문제를 해결해기 위해 Muon 옵티마이저를 개선한 MuonClip + qk-clip 기법이 활용되었습니다.
qk-clip은 쿼리와 키 프로젝션의 가중치 행렬을 직접 스케일 조정하는 방식인데요(Q와 K에 조절 장치를 달아서 곱한 결과를 모델 내에서 자동 축소). Muon뿐 아니라 다른 최적화 도구의 후처리 방식으로 적용 가능하다는 확장성이 있습니다.
이를 통해 토큰 15조 개(K2는 사전학습에 15.5조 개 학습) 이상의 학습에서 안정성과 효율성을 달성했고, Zero training Instability(훈련 도중 불안정성 없이 안정적으로 학습)를 실현했습니다.
단순한 엔지니어링 개선이 아닌, 대규모 모델 학습 효율성 측면의 새로운 축으로 학습 비용 자체를 재편하는 결과로 이어질 수 있습니다.
결론적으로 Kimi K2는 오픈소스 LLM 경쟁의 기준점을 다시 정의했습니다.
딥시크를 포함해 중국 AI의 발전 방향성은 효율성 극대화에 포커싱되어있는데요. 향후 활용된 MuonClip 기법이 유의미한 기술적 전환점으로 작용할 수 있을지 주목할 필요가 있습니다.
(2025/7/14 공표자료)
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
주말간 AI 씬에 이슈가 많아 전달드리는 내용이 많은데요, 중국 AI의 유의미한 발전에서 주목할 내용이 있습니다. 바로 문샷 ai에서 오픈소스로 공개한 Kimi K2입니다.
Kimi K2는 파라미터 1조 개에 활성 파라미터 320억 개의 MoE 모델입니다. 연구 및 파인 튜닝용 kimi-K2-Base와 채팅 및 에이전트 작업에 최적화된 kimi-K2-Instruct로 구성되는데요(로컬 구동은 다소 어려운 사이즈지만..)
성능 면에서 기존 선두 추론 모델을 압도하지는 않지만, 오픈소스 모델 내 SOTA 지위를 부여할 수 있고, 저렴한 API 가격(인풋 $0.15(캐싱 o) 및 $0.6(캐싱 x), 아웃풋 $2.5/백만토큰)도 강점입니다.
모델 구조는 딥시크 V3와 유사하지만, 헤드(Head) 수 감소로 장문 컨텍스트 효율성을 향상시켰고, 활성 전문가가 증가했지만, 토큰 효율성을 극대화했습니다.
K2는 에이전트적 기능 강화를 통한 복잡한 작업 실행 능력도 보여주고 있는데요 급여 분석, 런던 콘서트 기획 등 시연에서는 실제 업무 실행이 가능한 AI 시스템으로 진화도 엿볼 수 있네요.
에이전트 능력은 1) 툴 사용 학습을 위한 대규모 에이전트형 합성 데이터 구축, 2) 범용 강화학습을 기반으로 합니다.
허깅페이스 내 트렌딩 1위에 오르고, 오픈라우터에서 xAI 점유율을 넘었으며, 후기 학습 진행 후 퍼플렉시티 탑재 예정이라는 점도 의미 있는 확산력을 보여줍니다.
기술적 측면에서 주목할 부분은 MuonClip 최적화 기법의 도입입니다.
문샷은 앞서 진행한 Moonlight 연구에서 Muon 옵티마이저가 서구 AI 기업이 주로 채택하는 AdamW 대비 뛰어난 성과를 낸다는 것을 확인했습니다.
다만 토큰 확장 과정에서 attention 매커니즘의 logit 폭주(쿼리(Q)와 키(K)의 숫자가 커져 곱한 결과(logit)도 커짐 → AI가 한 곳만 보고 다른 것은 무시)로 인한 학습 불완정성은 Muon 기반에서 더 자주 발생하는 경향을 보였습니다.
불안정성은 모델 학습의 숨겨진 비용입니다. 학습 실패에 따른 재시작 리스크뿐 아니라, 안정화를 위해 고비용 구조를 채택하거나, 성능을 일부 포기해야했으니까요
K2에는 이러한 문제를 해결해기 위해 Muon 옵티마이저를 개선한 MuonClip + qk-clip 기법이 활용되었습니다.
qk-clip은 쿼리와 키 프로젝션의 가중치 행렬을 직접 스케일 조정하는 방식인데요(Q와 K에 조절 장치를 달아서 곱한 결과를 모델 내에서 자동 축소). Muon뿐 아니라 다른 최적화 도구의 후처리 방식으로 적용 가능하다는 확장성이 있습니다.
이를 통해 토큰 15조 개(K2는 사전학습에 15.5조 개 학습) 이상의 학습에서 안정성과 효율성을 달성했고, Zero training Instability(훈련 도중 불안정성 없이 안정적으로 학습)를 실현했습니다.
단순한 엔지니어링 개선이 아닌, 대규모 모델 학습 효율성 측면의 새로운 축으로 학습 비용 자체를 재편하는 결과로 이어질 수 있습니다.
결론적으로 Kimi K2는 오픈소스 LLM 경쟁의 기준점을 다시 정의했습니다.
딥시크를 포함해 중국 AI의 발전 방향성은 효율성 극대화에 포커싱되어있는데요. 향후 활용된 MuonClip 기법이 유의미한 기술적 전환점으로 작용할 수 있을지 주목할 필요가 있습니다.
(2025/7/14 공표자료)
👍3
[삼성 이영진] 글로벌 AI/SW
xAI, Grok 4 발표 주요 내용 - 슈퍼 휴먼 레벨로 리즈닝 가능. 학부생 수준을 넘어 모든 분야에서 박사급 이상의 성능이라는 코멘트 - HLE(Humanity's Last Exam) 벤치마크 결과: 26.9%(no tool), 41%(with tool) - Scaling Test Time을 통해 HLE 벤치마크 결과도 개선 - GPQA 포함 여러 수학 과학 벤치마크 SOTA. AIME 2025는 100% - Grok 4 Heavy는…
일론 머스크, Grok V7 기능 관련 발언
“우리가 V7 파운데이션 모델(Grok 4는 V6)의 학습을 완료하면 기능이 크게 도약할 것입니다. 이미지/영상 이해 능력이 훨씬 뛰어나고, 영상 생성 모델도 포함되어 있습니다.”
“Grok은 자기가 만든 게임을 ‘보고’ 직접 ‘플레이’할 수 있으며, 버그를 수정하고 기능을 추가하면서 스스로 게임이 훌륭하다고 판단할 때까지 개선할 수 있게 될 것입니다.”
: Grok 4 공개 당시 영상 생성 모델 타임라인은 10월
“우리가 V7 파운데이션 모델(Grok 4는 V6)의 학습을 완료하면 기능이 크게 도약할 것입니다. 이미지/영상 이해 능력이 훨씬 뛰어나고, 영상 생성 모델도 포함되어 있습니다.”
“Grok은 자기가 만든 게임을 ‘보고’ 직접 ‘플레이’할 수 있으며, 버그를 수정하고 기능을 추가하면서 스스로 게임이 훌륭하다고 판단할 때까지 개선할 수 있게 될 것입니다.”
: Grok 4 공개 당시 영상 생성 모델 타임라인은 10월
❤3👍1
저커버그, 슈퍼인텔리전스와 컴퓨팅 관련 코멘트
“우리의 슈퍼인텔리전스 프로젝트를 위해, 업계에서 가장 엘리트하고 인재 밀도가 높은 팀을 만드는 데 집중하고 있습니다. 우리는 슈퍼인텔리전스를 구축하기 위해 컴퓨팅 자원에 수천억 달러를 투자할 예정입니다. 이를 실행할 수 있는 자본은 우리 비즈니스에서 확보되어 있습니다.”
“SemiAnalysis가 메타가 업계 최초로 1GW 이상의 슈퍼클러스터를 가동할 예정이라고 보도했습니다. 💪”
“우리는 실제로 여러 개의 GW급 클러스터를 구축 중입니다. 첫 번째는 프로메테우스(Prometheus)라고 부르며, 2026년에 가동될 예정입니다.
“또한 하이페리온(Hyperion)이라는 클러스터도 구축 중이며, 이는 수 년에 걸쳐 최대 5GW까지 확장 가능하도록 설계되어 있습니다.이 외에도 다수의 타이탄(Titan)클러스터들을 짓고 있으며, 이들 중 하나만으로도 맨해튼의 상당 부분 면적을 차지할 규모입니다.”
“Meta Superintelligence Labs는 업계 최고 수준의 컴퓨팅 리소스를 갖출 것이며, 연구자 1인당 컴퓨팅 자원은 업계 최고 수준이 될 것입니다. 최고의 연구자들과 함께 미래의 경계를 확장해 나가기를 기대하고 있습니다!”
“우리의 슈퍼인텔리전스 프로젝트를 위해, 업계에서 가장 엘리트하고 인재 밀도가 높은 팀을 만드는 데 집중하고 있습니다. 우리는 슈퍼인텔리전스를 구축하기 위해 컴퓨팅 자원에 수천억 달러를 투자할 예정입니다. 이를 실행할 수 있는 자본은 우리 비즈니스에서 확보되어 있습니다.”
“SemiAnalysis가 메타가 업계 최초로 1GW 이상의 슈퍼클러스터를 가동할 예정이라고 보도했습니다. 💪”
“우리는 실제로 여러 개의 GW급 클러스터를 구축 중입니다. 첫 번째는 프로메테우스(Prometheus)라고 부르며, 2026년에 가동될 예정입니다.
“또한 하이페리온(Hyperion)이라는 클러스터도 구축 중이며, 이는 수 년에 걸쳐 최대 5GW까지 확장 가능하도록 설계되어 있습니다.이 외에도 다수의 타이탄(Titan)클러스터들을 짓고 있으며, 이들 중 하나만으로도 맨해튼의 상당 부분 면적을 차지할 규모입니다.”
“Meta Superintelligence Labs는 업계 최고 수준의 컴퓨팅 리소스를 갖출 것이며, 연구자 1인당 컴퓨팅 자원은 업계 최고 수준이 될 것입니다. 최고의 연구자들과 함께 미래의 경계를 확장해 나가기를 기대하고 있습니다!”
👍3❤1
[삼성 이영진] 글로벌 AI/SW 헤드라인 (25/7/15)
■ 저커버그, 슈퍼인텔리전스 구축을 위한 컴퓨팅 투자 강조. 루이지애나 Hyperion 데이터센터는 최대 5GW까지 확장 가능 설계. ‘26년 오하이오 Prometheus 1GW 데이터센터 가동 예정
■ 메타, 슈퍼인텔리전스 팀 내 거대 모델 Behemoth 폐기 및 기존 오픈소스에서 폐쇄형 모델 개발 전환 고려 보도
■ 미 국방부 CDAO, 구글, 오픈AI, xAI, 앤스로픽과 각각 최대 2억 달러 규모 계약 체결. 에이전틱 AI 워크플로우 구축 목표
■ xAI, 미 연방 정부 대상 Grok for Government 발표. Grok 모델과 AI 툴 통합 제공
■ xAI, Super Grok 구독자 대상으로 AI 컴패니언 기능 출시
■ 일론 머스크, 테슬라-xAI 합병에 반대 의견. 반면 테슬라의 xAI 투자는 찬성하나, 주주 투표 결정이 필요하다는 입장
■ 트럼프 대통령, 펜실베니아 주 내 AI 및 에너지 인프라 관련 700억 달러 투자 계획 발표 예정
■ 트럼프 행정부, 국방부 내 4년 간 10억 달러 규모 공격적 사이버 작전 예산 편성. 인도-태평양 사렁부 사이버 역량 강화에 사용. 국방 예산 내 방어적 사이버 보안 예산은 10억 달러 삭감
■ Cognition, AI 스타트업 Windsurf 인수 발표. IP, 제품, 데이터, 브랜드와 잔여 조직 인수. Cognition은 AI 코딩 에이전트 Devin 개발사
■ 트레이드데스크, 시놉시스에 인수된 앤시스를 대신하여 S&P500 편입
■ 샌프란시스코, 3만 명의 시 공무원 대상으로 MS 365 코파일럿 제공
■ 구글 NotebookLM, 다양한 출처와 협업한 Featured Notebooks(추천 노트북) 기능 도입
■ 말레이시아, 미국산 고성능 AI 칩 수출,환적, 통과 시 무역허가 의무화
감사합니다.
■ 저커버그, 슈퍼인텔리전스 구축을 위한 컴퓨팅 투자 강조. 루이지애나 Hyperion 데이터센터는 최대 5GW까지 확장 가능 설계. ‘26년 오하이오 Prometheus 1GW 데이터센터 가동 예정
■ 메타, 슈퍼인텔리전스 팀 내 거대 모델 Behemoth 폐기 및 기존 오픈소스에서 폐쇄형 모델 개발 전환 고려 보도
■ 미 국방부 CDAO, 구글, 오픈AI, xAI, 앤스로픽과 각각 최대 2억 달러 규모 계약 체결. 에이전틱 AI 워크플로우 구축 목표
■ xAI, 미 연방 정부 대상 Grok for Government 발표. Grok 모델과 AI 툴 통합 제공
■ xAI, Super Grok 구독자 대상으로 AI 컴패니언 기능 출시
■ 일론 머스크, 테슬라-xAI 합병에 반대 의견. 반면 테슬라의 xAI 투자는 찬성하나, 주주 투표 결정이 필요하다는 입장
■ 트럼프 대통령, 펜실베니아 주 내 AI 및 에너지 인프라 관련 700억 달러 투자 계획 발표 예정
■ 트럼프 행정부, 국방부 내 4년 간 10억 달러 규모 공격적 사이버 작전 예산 편성. 인도-태평양 사렁부 사이버 역량 강화에 사용. 국방 예산 내 방어적 사이버 보안 예산은 10억 달러 삭감
■ Cognition, AI 스타트업 Windsurf 인수 발표. IP, 제품, 데이터, 브랜드와 잔여 조직 인수. Cognition은 AI 코딩 에이전트 Devin 개발사
■ 트레이드데스크, 시놉시스에 인수된 앤시스를 대신하여 S&P500 편입
■ 샌프란시스코, 3만 명의 시 공무원 대상으로 MS 365 코파일럿 제공
■ 구글 NotebookLM, 다양한 출처와 협업한 Featured Notebooks(추천 노트북) 기능 도입
■ 말레이시아, 미국산 고성능 AI 칩 수출,환적, 통과 시 무역허가 의무화
감사합니다.
👍3❤1
미 국방부와 4대 프론티어 AI 기업 간 파트너십 발표
: 오픈AI, 구글, 앤스로픽, xAI와 각각 최대 2억 달러 규모. 계약 주체는 국방부 산하 CDAO(Chief Digital and AI Office)
: 국가 안보 관련 핵심 임무 분야에서 첨단 AI 역량 도입 및 적용 가속화. 에이전틱 AI 워크플로우 개발 및 국방부 맞춤형 AI 솔루션 공동 설계
: GSA와 협업을 통해 연방 정부 전체의 AI 도입 비용 효율성 확보 및 컴퓨팅 자원 공동 조달 체계 구축
■ 오픈AI(6/16일 발표)
: 전투 작전 및 국방 조직 운영을 지원하는 첨단 AI 시스템 시제품 구축 목적. OpenAI for Government - 보안 및 규제를 준수하는 커스텀 모델 제공+현장 밀착형 기술 지원
■ 구글
: 구글 클라우드 및 TPU 인프라, Agentspace(에이전트형 AI 개발 및 운영 플랫폼) 제공
■ 앤스로픽
: 국방부 데이터 기반 AI 모델을 정밀 튜닝한 프로토타입 개발. Claude Gov 모델(기밀 자료 이해, 작전 계획 및 정보 분석 특화) 활용. 책임 있는 AI 개발 원칙 강조
■ xAI
: Grok for Government - Grok 4 모델과 Deep Search, Tool Use 등 기능 통합 제공. GSA 플랫폼 등록으로 연방 및 지방기관 도입 지원
https://www.ai.mil/Latest/News-Press/PR-View/Article/4242822/cdao-announces-partnerships-with-frontier-ai-companies-to-address-national-secu/
: 오픈AI, 구글, 앤스로픽, xAI와 각각 최대 2억 달러 규모. 계약 주체는 국방부 산하 CDAO(Chief Digital and AI Office)
: 국가 안보 관련 핵심 임무 분야에서 첨단 AI 역량 도입 및 적용 가속화. 에이전틱 AI 워크플로우 개발 및 국방부 맞춤형 AI 솔루션 공동 설계
: GSA와 협업을 통해 연방 정부 전체의 AI 도입 비용 효율성 확보 및 컴퓨팅 자원 공동 조달 체계 구축
■ 오픈AI(6/16일 발표)
: 전투 작전 및 국방 조직 운영을 지원하는 첨단 AI 시스템 시제품 구축 목적. OpenAI for Government - 보안 및 규제를 준수하는 커스텀 모델 제공+현장 밀착형 기술 지원
■ 구글
: 구글 클라우드 및 TPU 인프라, Agentspace(에이전트형 AI 개발 및 운영 플랫폼) 제공
■ 앤스로픽
: 국방부 데이터 기반 AI 모델을 정밀 튜닝한 프로토타입 개발. Claude Gov 모델(기밀 자료 이해, 작전 계획 및 정보 분석 특화) 활용. 책임 있는 AI 개발 원칙 강조
■ xAI
: Grok for Government - Grok 4 모델과 Deep Search, Tool Use 등 기능 통합 제공. GSA 플랫폼 등록으로 연방 및 지방기관 도입 지원
https://www.ai.mil/Latest/News-Press/PR-View/Article/4242822/cdao-announces-partnerships-with-frontier-ai-companies-to-address-national-secu/
Chief Digital and Artificial Intelligence Office
CDAO Announces Partnerships with Frontier AI Companies to Address Nati
The CDAO is partnering with the nation's leading AI labs — Anthropic, Google, OpenAI, and xAI — to address critical national security challenges. These efforts will prototype frontier AI technologies,
👍1
Forwarded from [삼성 문준호의 반도체를 전하다]
엔비디아 H20 대중 수출 업데이트
이번 달, NVIDIA의 창립자이자 CEO인 젠슨 황(Jensen Huang)은 워싱턴 D.C.와 베이징을 방문해 인공지능(AI)의 중요성을 강조하며, AI가 전 세계 비즈니스와 사회에 가져올 이점들을 부각시켰습니다.
미국 수도 워싱턴 D.C.에서는 도널드 트럼프 대통령 및 미국 정책 입안자들과 만남을 가졌으며, 이 자리에서 황 CEO는 일자리 창출, 국내 AI 인프라 강화, 제조업의 리쇼어링(국내 복귀), 그리고 미국이 전 세계 AI 분야에서 주도권을 유지할 수 있도록 하는 정부의 노력에 NVIDIA가 지지 의사를 재확인했습니다.
베이징에서는 정부 및 산업계 관계자들과 만나 AI가 어떻게 생산성을 높이고 기회를 확대할 수 있을지를 논의했습니다. 이 논의는 전 세계 연구자들이 모두를 위한 안전하고 신뢰할 수 있는 AI 개발을 어떻게 협력할 수 있는지를 강조하는 자리였습니다.
황 CEO는 고객들에게도 최신 정보를 전했는데, NVIDIA가 다시 한 번 H20 GPU의 판매 허가를 신청 중이라고 밝혔습니다. 미국 정부는 NVIDIA에 대해 해당 라이선스를 발급할 것임을 보장했으며, NVIDIA는 곧 제품을 출하할 수 있기를 기대하고 있다고 밝혔습니다. 아울러 그는 새로운 RTX PRO GPU를 발표했으며, 이 제품은 “스마트 팩토리와 물류용 디지털 트윈 AI에 최적화된 제품”이라며 관련 규제를 완전히 준수한다고 덧붙였습니다.
황 CEO는 이번 방문에서 “세계는 지금 중대한 전환점에 도달했다”며, “AI는 에너지, 물, 인터넷과 같이 필수 자원이 되었다”고 강조했습니다. 또한 그는 NVIDIA가 오픈소스 연구, 기반 모델(foundation models), 그리고 AI 응용기술 지원에 전념하고 있으며, 이를 통해 AI의 민주화를 실현하고 라틴 아메리카, 유럽, 아시아 등 모든 지역의 신흥 경제권을 지원할 것이라고 밝혔습니다.
그는 워싱턴에서 기자들에게 다음과 같이 설명했습니다.
“범용적인 오픈소스 연구와 기반 모델은 AI 혁신의 핵심입니다. 우리는 모든 민간 AI 모델이 미국 기술 스택에서 가장 잘 작동해야 한다고 믿습니다. 이를 통해 전 세계 국가들이 미국을 선택하게 될 것입니다.”
https://blogs.nvidia.com/blog/nvidia-ceo-promotes-ai-in-dc-and-china/
이번 달, NVIDIA의 창립자이자 CEO인 젠슨 황(Jensen Huang)은 워싱턴 D.C.와 베이징을 방문해 인공지능(AI)의 중요성을 강조하며, AI가 전 세계 비즈니스와 사회에 가져올 이점들을 부각시켰습니다.
미국 수도 워싱턴 D.C.에서는 도널드 트럼프 대통령 및 미국 정책 입안자들과 만남을 가졌으며, 이 자리에서 황 CEO는 일자리 창출, 국내 AI 인프라 강화, 제조업의 리쇼어링(국내 복귀), 그리고 미국이 전 세계 AI 분야에서 주도권을 유지할 수 있도록 하는 정부의 노력에 NVIDIA가 지지 의사를 재확인했습니다.
베이징에서는 정부 및 산업계 관계자들과 만나 AI가 어떻게 생산성을 높이고 기회를 확대할 수 있을지를 논의했습니다. 이 논의는 전 세계 연구자들이 모두를 위한 안전하고 신뢰할 수 있는 AI 개발을 어떻게 협력할 수 있는지를 강조하는 자리였습니다.
황 CEO는 고객들에게도 최신 정보를 전했는데, NVIDIA가 다시 한 번 H20 GPU의 판매 허가를 신청 중이라고 밝혔습니다. 미국 정부는 NVIDIA에 대해 해당 라이선스를 발급할 것임을 보장했으며, NVIDIA는 곧 제품을 출하할 수 있기를 기대하고 있다고 밝혔습니다. 아울러 그는 새로운 RTX PRO GPU를 발표했으며, 이 제품은 “스마트 팩토리와 물류용 디지털 트윈 AI에 최적화된 제품”이라며 관련 규제를 완전히 준수한다고 덧붙였습니다.
황 CEO는 이번 방문에서 “세계는 지금 중대한 전환점에 도달했다”며, “AI는 에너지, 물, 인터넷과 같이 필수 자원이 되었다”고 강조했습니다. 또한 그는 NVIDIA가 오픈소스 연구, 기반 모델(foundation models), 그리고 AI 응용기술 지원에 전념하고 있으며, 이를 통해 AI의 민주화를 실현하고 라틴 아메리카, 유럽, 아시아 등 모든 지역의 신흥 경제권을 지원할 것이라고 밝혔습니다.
그는 워싱턴에서 기자들에게 다음과 같이 설명했습니다.
“범용적인 오픈소스 연구와 기반 모델은 AI 혁신의 핵심입니다. 우리는 모든 민간 AI 모델이 미국 기술 스택에서 가장 잘 작동해야 한다고 믿습니다. 이를 통해 전 세계 국가들이 미국을 선택하게 될 것입니다.”
https://blogs.nvidia.com/blog/nvidia-ceo-promotes-ai-in-dc-and-china/
NVIDIA Blog
NVIDIA CEO Jensen Huang Promotes AI in Washington, DC and China
This month, NVIDIA founder and CEO Jensen Huang promoted AI in both Washington, D.C. and Beijing — emphasizing the benefits that AI will bring to business and society worldwide. In the U.S. capital, Huang met with President Trump and U.S. policymakers, reaffirming…
👍2
[삼성 이영진] 글로벌 AI/SW
중국의 문샷 ai가 보여준 진보 - Kimi K2와 MuonClip 안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다. 주말간 AI 씬에 이슈가 많아 전달드리는 내용이 많은데요, 중국 AI의 유의미한 발전에서 주목할 내용이 있습니다. 바로 문샷 ai에서 오픈소스로 공개한 Kimi K2입니다. Kimi K2는 파라미터 1조 개에 활성 파라미터 320억 개의 MoE 모델입니다. 연구 및 파인 튜닝용 kimi-K2-Base와 채팅 및 에이전트 작업에…
문샷ai Kimi K2, Artificial Analysis Index 57점
: 비추론 모델 기준 Claude 4 Opus(58점) > Kimi K2(57점) > Gemini 2.5 Flash & 딥시크 V3 (53점) > GPT-4.1(51점)
: 추론 모델 Magistral Medium(미스트랄 ai, 56점)과 o1-mini(54점) 상회
: 기존 Artificial Analysis 평가에서 추론과 비추론 구분 기준은 Reasoning 태그 사용 여부와 토큰 사용량. 추론 모델은 비추론 모델 대비 10배 많은 토큰 사용
: Kimi K2는 비추론 모델 중앙값 대비 3배의 토큰 사용. Claude 4 Sonnet과 Opus의 maximum budget extended thinking mode 사용량 대비 70% 수준
: 추론 비추론 모델 간 경계를 흐리게 만들고 있음
: 비추론 모델 기준 Claude 4 Opus(58점) > Kimi K2(57점) > Gemini 2.5 Flash & 딥시크 V3 (53점) > GPT-4.1(51점)
: 추론 모델 Magistral Medium(미스트랄 ai, 56점)과 o1-mini(54점) 상회
: 기존 Artificial Analysis 평가에서 추론과 비추론 구분 기준은 Reasoning 태그 사용 여부와 토큰 사용량. 추론 모델은 비추론 모델 대비 10배 많은 토큰 사용
: Kimi K2는 비추론 모델 중앙값 대비 3배의 토큰 사용. Claude 4 Sonnet과 Opus의 maximum budget extended thinking mode 사용량 대비 70% 수준
: 추론 비추론 모델 간 경계를 흐리게 만들고 있음
👍3