AIME 2025 시험 모델별 성적 공개
: AIME는 미국 수학경시대회. AIME I은 2/5일, AIME II는 2/13일 진행
: AI 모델이 기존 학습 내용을 반복하는 것이 아니라, 새로운 문제를 이해하고 해결하는 능력 확인
https://matharena.ai/
: AIME는 미국 수학경시대회. AIME I은 2/5일, AIME II는 2/13일 진행
: AI 모델이 기존 학습 내용을 반복하는 것이 아니라, 새로운 문제를 이해하고 해결하는 능력 확인
https://matharena.ai/
❤1👍1
퍼플렉시티, Deep Research 공식 출시
: 유저 질문에 수십 건의 검색과 수백 개 자료를 읽고 분석해 전문가 수준 심층 보고서 자동 생성
: HLE 벤치마크 20.5% 및 SimpleQA 93.9%. o3 mini, R1 등 상회
vs 오픈AI Deep Research → HLE 26.6%
: Pro 유저 500회/일, 무료 유저 5회/일
vs 오픈AI Deep Research → Pro 유저 100회/월. 샘 올트먼은 Plus 10회/월 및 무료 2회/월 제공 ‘계획’ 언급
: 웹으로 우선 제공, 모바일 및 Mac 업데이트 예정
: 대부분 태스크를 3분 이내로 수행. 아라빈드 CEO는 적절하지 않은 디테일 추가와 보고서 길이 증가가 더 나은 결과를 보장 하지않는다는 점 강조
https://www.perplexity.ai/hub/blog/introducing-perplexity-deep-research
: 유저 질문에 수십 건의 검색과 수백 개 자료를 읽고 분석해 전문가 수준 심층 보고서 자동 생성
: HLE 벤치마크 20.5% 및 SimpleQA 93.9%. o3 mini, R1 등 상회
vs 오픈AI Deep Research → HLE 26.6%
: Pro 유저 500회/일, 무료 유저 5회/일
vs 오픈AI Deep Research → Pro 유저 100회/월. 샘 올트먼은 Plus 10회/월 및 무료 2회/월 제공 ‘계획’ 언급
: 웹으로 우선 제공, 모바일 및 Mac 업데이트 예정
: 대부분 태스크를 3분 이내로 수행. 아라빈드 CEO는 적절하지 않은 디테일 추가와 보고서 길이 증가가 더 나은 결과를 보장 하지않는다는 점 강조
https://www.perplexity.ai/hub/blog/introducing-perplexity-deep-research
❤2👍1
xAI, 750억 달러 밸류로 100억 달러 펀딩 논의
: 기존 투자자인 Sequoia Capital, Andreessen Horowitz, Valor Equity Partners 등이 참여할 가능성
: 24년 시리즈 B,C를 통해 60억 달러씩 자금 조달. 이전 밸류는 510억 달러
https://www.bloomberg.com/news/articles/2025-02-14/musk-s-xai-discussing-10-billion-raise-at-75-billion-valuation
: 기존 투자자인 Sequoia Capital, Andreessen Horowitz, Valor Equity Partners 등이 참여할 가능성
: 24년 시리즈 B,C를 통해 60억 달러씩 자금 조달. 이전 밸류는 510억 달러
https://www.bloomberg.com/news/articles/2025-02-14/musk-s-xai-discussing-10-billion-raise-at-75-billion-valuation
Bloomberg.com
Musk’s xAI Discussing $10 Billion Raise at $75 Billion Valuation
Elon Musk’s artificial intelligence company xAI is canvassing potential investors for a roughly $10 billion funding round that would value the company at about $75 billion, according to a person with knowledge of the matter.
👍2❤1
[삼성 이영진] 글로벌 SW 헤드라인 (25/2/17)
■ 일론 머스크, 월요일 밤 8시(PT) Grok 3 출시 및 라이브 데모 예정 발표
■ xAI, 750억 달러 밸류로 100억 달러 펀딩 논의
■ 오픈AI 이사회, 만장일치로 일론 머스크의 비영리 법인 인수 제안 거부
■ 샘 올트먼, 최근 챗GPT-4o 업데이트 관련 코멘트. 웹 검색 기능이 우수해졌다는 주장
■ 퍼플렉시티, 심층 조사 및 분석을 수행하는 딥 리서치 기능 출시
■ 앤스로픽, 영국 정부와 공공 서비스 부문에 Claude 모델 활용를 위한 MOU 체결
■ 마이크로소프트, 그래픽 사용자 인터페이스(GUI)를 이해하고 상호작용할 수 있도록 설계된 AI 에이전트 도구 OmniParser 2 오픈소스로 공개.
■ 피규어 AI, 395억 달러 밸류로 15억 달러 펀딩 논의. 24년 시리즈 B 펀딩 밸류 26억 달러 대비 15배
■ 메타, 리얼리티 랩스 내 신규 팀 주도로 AI 기반 휴머노이드 로봇 개발 위한 투자 시작
■ 아마존, 2/26일 이벤트에서 새로운 Alexa 공개 예정이었으나, 3월 이후로 출시 연기
■ 애플, 엔지니어링과 버그 이슈에 따라 Siri의 일부 AI 기능 출시가 기존 4월에서 5월 이후로 지연 가능성
■ 시진핑 주석, 베이징에서 테크 기업 CEO와 좌담회 진행 예정. 딥시크 창립자 량원펑을 비롯해 6마리 용으로 불리는 AI 스타트업 6곳 포함. 알리바바 마윈과 텐센트, 샤오미 등 수장도 참석
■ 텐센트, Weixin 내 딥시크 AI 모델 통합 베타 테스트 진행 발표
감사합니다.
■ 일론 머스크, 월요일 밤 8시(PT) Grok 3 출시 및 라이브 데모 예정 발표
■ xAI, 750억 달러 밸류로 100억 달러 펀딩 논의
■ 오픈AI 이사회, 만장일치로 일론 머스크의 비영리 법인 인수 제안 거부
■ 샘 올트먼, 최근 챗GPT-4o 업데이트 관련 코멘트. 웹 검색 기능이 우수해졌다는 주장
■ 퍼플렉시티, 심층 조사 및 분석을 수행하는 딥 리서치 기능 출시
■ 앤스로픽, 영국 정부와 공공 서비스 부문에 Claude 모델 활용를 위한 MOU 체결
■ 마이크로소프트, 그래픽 사용자 인터페이스(GUI)를 이해하고 상호작용할 수 있도록 설계된 AI 에이전트 도구 OmniParser 2 오픈소스로 공개.
■ 피규어 AI, 395억 달러 밸류로 15억 달러 펀딩 논의. 24년 시리즈 B 펀딩 밸류 26억 달러 대비 15배
■ 메타, 리얼리티 랩스 내 신규 팀 주도로 AI 기반 휴머노이드 로봇 개발 위한 투자 시작
■ 아마존, 2/26일 이벤트에서 새로운 Alexa 공개 예정이었으나, 3월 이후로 출시 연기
■ 애플, 엔지니어링과 버그 이슈에 따라 Siri의 일부 AI 기능 출시가 기존 4월에서 5월 이후로 지연 가능성
■ 시진핑 주석, 베이징에서 테크 기업 CEO와 좌담회 진행 예정. 딥시크 창립자 량원펑을 비롯해 6마리 용으로 불리는 AI 스타트업 6곳 포함. 알리바바 마윈과 텐센트, 샤오미 등 수장도 참석
■ 텐센트, Weixin 내 딥시크 AI 모델 통합 베타 테스트 진행 발표
감사합니다.
❤2👍1
글로벌 소프트웨어, 4Q24 실적 시즌 중간 점검 - Ready for Second Round
안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.
빅테크와 12월 결산 SW 기업 실적 발표가 마무리되며, 실적 시즌도 중반을 넘어가고 있는데요. 앞선 실적의 시사점 몇 가지를 꼽아보려합니다.
■ 빅테크 Capex 투자와 캐파 제약
빅테크의 클라우드 부문 실적 하회 이유는 1) AI 캐파 부족, 2) 환율 영향입니다.
이는 폭발적 AI 수요 증가 때문입니다. 고성능 추론 모델 등장과 함께 API 가격(P)은 급격하게 하락하고, 서비스 개발 수요(Q)는 폭증하고 있습니다. 하지만 캐파 부족으로 Q를 제대로 흡수할 수 없는 상황에서 매출 성장이 기대 대비 부진한 것입니다.
이를 해결하기 위해 모두 공격적 CapEx 투자 의지를 강조했습니다.
학습 대비 상대 마진이 높은 추론 성장에 대한 수혜는 지속될 것으로 보입니다. 하이퍼스케일러의 AI 매출 성장이라는 방향성은 훼손되지 않았습니다.
■ 사용량 소프트웨어 기업 실적 기대감
아쉬운 클라우드 인프라 기업 실적과 달리 사용량 기반 SW 기업 실적은 견조한 모습을 보여주었습니다.
'데이터'라는 범주 내 기업 별 포지셔닝과 경쟁 강도 등은 다르지만, AI 시대 관련 기업 모멘텀은 쉽게 지나쳐서는 안됩니다.
■ 견조한 사이버 보안 수요
이번 분기 대부분 사이버 보안 기업 실적은 긍정적 흐름을 이어가고 있습니다.
산업 전반에 걸친 AI 확대 적용 기조는 클라우드 보안, 엔드 포인트 보안, 보안 운영 등 다양한 사업 보안 분야에 대한 수요로 연결됩니다.
AI를 논외로 두더라도 보안 산업 성장은 일종의 메가 트렌드입니다. 개별 기업단의 불확실성만 제거된다면 편안한 선택지가 될 것입니다.
■ 다소 애매한 AI 에이전트?
서비스나우 실적 부진이 AI 에이전트에 대한 기대감을 다소 다운시킨 것은 사실입니다. 아직도 초기 단계라는 것이 확인되었으니까요
하지만 프론티어 AI 기업이 여러 에이전틱 기능을 선보였고, 모델의 똑똑함은 더욱 깊어지고 있습니다. 에이전트 대표 기업 세일즈포스의 실적이 중요합니다.
■ 차세대 AI 모델, 큰 거 온다
딥시크 이슈로 소프트웨어 섹터 수혜 기대감이 고조되었지만, 개별 기업 단으로 주가가 엇갈리는 모습을 보이며 전체적으로 폭발적 모습은 아닙니다.
딥시크는 거대한 가격 하락 트렌드의 가속화 포인트지만, 완전히 새로운 방향성은 아닌 만큼 추론 수요 성장에서 조급함을 가질 필요는 없다고 예상합니다.
기대감이 대두되고 있는 차세대 모델의 강력함과 가성비는 소프트웨어 섹터 내 추가 모멘텀이 될 수 있습니다
보고서 링크: https://bit.ly/4hwRpAt
(2025/2/17 공표자료)
안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.
빅테크와 12월 결산 SW 기업 실적 발표가 마무리되며, 실적 시즌도 중반을 넘어가고 있는데요. 앞선 실적의 시사점 몇 가지를 꼽아보려합니다.
■ 빅테크 Capex 투자와 캐파 제약
빅테크의 클라우드 부문 실적 하회 이유는 1) AI 캐파 부족, 2) 환율 영향입니다.
이는 폭발적 AI 수요 증가 때문입니다. 고성능 추론 모델 등장과 함께 API 가격(P)은 급격하게 하락하고, 서비스 개발 수요(Q)는 폭증하고 있습니다. 하지만 캐파 부족으로 Q를 제대로 흡수할 수 없는 상황에서 매출 성장이 기대 대비 부진한 것입니다.
이를 해결하기 위해 모두 공격적 CapEx 투자 의지를 강조했습니다.
학습 대비 상대 마진이 높은 추론 성장에 대한 수혜는 지속될 것으로 보입니다. 하이퍼스케일러의 AI 매출 성장이라는 방향성은 훼손되지 않았습니다.
■ 사용량 소프트웨어 기업 실적 기대감
아쉬운 클라우드 인프라 기업 실적과 달리 사용량 기반 SW 기업 실적은 견조한 모습을 보여주었습니다.
'데이터'라는 범주 내 기업 별 포지셔닝과 경쟁 강도 등은 다르지만, AI 시대 관련 기업 모멘텀은 쉽게 지나쳐서는 안됩니다.
■ 견조한 사이버 보안 수요
이번 분기 대부분 사이버 보안 기업 실적은 긍정적 흐름을 이어가고 있습니다.
산업 전반에 걸친 AI 확대 적용 기조는 클라우드 보안, 엔드 포인트 보안, 보안 운영 등 다양한 사업 보안 분야에 대한 수요로 연결됩니다.
AI를 논외로 두더라도 보안 산업 성장은 일종의 메가 트렌드입니다. 개별 기업단의 불확실성만 제거된다면 편안한 선택지가 될 것입니다.
■ 다소 애매한 AI 에이전트?
서비스나우 실적 부진이 AI 에이전트에 대한 기대감을 다소 다운시킨 것은 사실입니다. 아직도 초기 단계라는 것이 확인되었으니까요
하지만 프론티어 AI 기업이 여러 에이전틱 기능을 선보였고, 모델의 똑똑함은 더욱 깊어지고 있습니다. 에이전트 대표 기업 세일즈포스의 실적이 중요합니다.
■ 차세대 AI 모델, 큰 거 온다
딥시크 이슈로 소프트웨어 섹터 수혜 기대감이 고조되었지만, 개별 기업 단으로 주가가 엇갈리는 모습을 보이며 전체적으로 폭발적 모습은 아닙니다.
딥시크는 거대한 가격 하락 트렌드의 가속화 포인트지만, 완전히 새로운 방향성은 아닌 만큼 추론 수요 성장에서 조급함을 가질 필요는 없다고 예상합니다.
기대감이 대두되고 있는 차세대 모델의 강력함과 가성비는 소프트웨어 섹터 내 추가 모멘텀이 될 수 있습니다
보고서 링크: https://bit.ly/4hwRpAt
(2025/2/17 공표자료)
❤3
[삼성 이영진] 글로벌 AI/SW
일론 머스크, 월요일 밤 8시(PT) Grok 3 출시 및 라이브 데모 예고 “지구 상 가장 똑똑한 AI” 라는 코멘트
Grok 3에 대한 머스크의 추가 코멘트. 화요일 오후 1시(한국시간) 데모 예정
👍2❤1
[삼성 이영진] 글로벌 SW 헤드라인 (25/2/18)
■ 샘 올트먼, GPT-4.5 테스터들이 예상했던 것 보다 더 AGI 모먼트를 느끼고 있다는 코멘트
■ SSI, 300억 달러 이상 밸류로 10억 달러 이상 펀딩 보도
■ 뉴욕 타임즈, 자사 제품 및 편집팀에 내부 AI 요약 툴 Echo 포함 AI 도구 사용 공식 승인
■ 마이크로소프트, 폴란드에 7억 달러 투자 발표. 데이터센터 확장, AI 및 사이버 보안 강화 등 목표
■ 딥시크 R1, NPR 선데이 퍼즐 퀴즈를 활용한 벤치마크 테스트에서 추론을 포기하거나 틀린 답을 제출하고 어려운 문제 직면 시 짜증난다는 표현
■ 미스트랄 AI, 아랍어와 중동 문화 기반 AI 모델 Mistral Saba 발표
감사합니다.
■ 샘 올트먼, GPT-4.5 테스터들이 예상했던 것 보다 더 AGI 모먼트를 느끼고 있다는 코멘트
■ SSI, 300억 달러 이상 밸류로 10억 달러 이상 펀딩 보도
■ 뉴욕 타임즈, 자사 제품 및 편집팀에 내부 AI 요약 툴 Echo 포함 AI 도구 사용 공식 승인
■ 마이크로소프트, 폴란드에 7억 달러 투자 발표. 데이터센터 확장, AI 및 사이버 보안 강화 등 목표
■ 딥시크 R1, NPR 선데이 퍼즐 퀴즈를 활용한 벤치마크 테스트에서 추론을 포기하거나 틀린 답을 제출하고 어려운 문제 직면 시 짜증난다는 표현
■ 미스트랄 AI, 아랍어와 중동 문화 기반 AI 모델 Mistral Saba 발표
감사합니다.
👍2❤1
프론티어 AI 기업의 높아지는 밸류와 펀딩 - Feel the AGI
안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.
샘 올트먼은 전일 X에 "GPT-4.5 테스터들이 예상했던 것보다 더 AGI 모먼트를 느끼고 있다"는 코멘트를 남겼습니다.
불과 지난달 "AGI 하입이 과도하며 기대치를 100배 낮춰야 한다"는 코멘트를 한 것에서 다시 의견이 바뀌었는데요
올트먼 포함 오픈AI 측에서 AGI(범용인공지능)를 바라보는 기준 자체가 이전보다 낮아진 느낌을 받고 있지만, AGI 관련 코멘트는 더욱 많아지고 있습니다(하입은 스스로 만들어 내는 것..?)
최근 블로그 글(Three Observations)에서는 AGI를 "인간 수준에서 다양한 분야의 복잡한 문제를 해결할 수 있는 시스템"으로 정의했는데요.
AGI의 정확한 정의를 내리는 것이 중요할 정도로 가까워지고 있다는 코멘트도 남겼습니다.
여러 오픈AI 임원도 내부적으로 AGI에 도달할 수 있는 방법을 찾았다고 느끼고 있으며, 가까운 미래에 도달 가능하다는 의견을 피력하고 있습니다.
당연하게도 AGI 달성을 위한 레이스에는 막대한 투자가 필요합니다.
최근 프론티어 AI 기업들이 높은 밸류에이션으로 막대한 펀딩을 진행하고 있는 것도 이와 연계됩니다. 투자를 받아야 capex 투자 및 연구 개발 비용 충당이 가능하기 때문이지요
1) 오픈AI → 3,000억 달러 밸류로 400억 달러 펀딩 논의(소프트뱅크 참여, 스타게이트 프로젝트와 연결)
2) xAI → 750억 달러 밸류로 100억 달러 펀딩 논의
3) SSI(일리야 수츠케버) → 2월 초 200억 달러 밸류에서 상승한 300억 달러 이상 밸류로 10억 달러 이상 펀딩 논의 보도
4) 앤스로픽 → 600억 달러 밸류에 20억 달러 펀딩 보도(1월, Lightspeed Venture 주도) + 구글 10억 달러 추가 투자
단순하게 생각하면 프론티어 AI 기업이 엄청난 펀딩을 통해 투자를 계획하는 것은 인프라 수요에 긍정적입니다.
다만 추론 수요 상승을 대비해 Capex를 투자하는 빅테크와는 결이 약간은 다릅니다. 추론 서비스를 통한 수익화 측면과 내부 적용보다 '학습'에 포커싱되어있기 때문인데요
하지만 AGI를 달성한다면 파생되어 활용될 수 있는 분야는 더욱 확대될 수 있습니다.
AGI가 끝이 아닙니다. ASI(초지능) 레이스도 계속되겠지요. 수츠케버의 SSI가 아무런 프로덕트 없이 밸류가 높아지고 있는 것이 이를 반증합니다.
AI 생태계 확장은 인프라에서 서비스로 사이클이 한 바퀴 도는 것으로 끝나지 않을 것 입니다.
(2025/2/18 공표자료)
안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.
샘 올트먼은 전일 X에 "GPT-4.5 테스터들이 예상했던 것보다 더 AGI 모먼트를 느끼고 있다"는 코멘트를 남겼습니다.
불과 지난달 "AGI 하입이 과도하며 기대치를 100배 낮춰야 한다"는 코멘트를 한 것에서 다시 의견이 바뀌었는데요
올트먼 포함 오픈AI 측에서 AGI(범용인공지능)를 바라보는 기준 자체가 이전보다 낮아진 느낌을 받고 있지만, AGI 관련 코멘트는 더욱 많아지고 있습니다(하입은 스스로 만들어 내는 것..?)
최근 블로그 글(Three Observations)에서는 AGI를 "인간 수준에서 다양한 분야의 복잡한 문제를 해결할 수 있는 시스템"으로 정의했는데요.
AGI의 정확한 정의를 내리는 것이 중요할 정도로 가까워지고 있다는 코멘트도 남겼습니다.
여러 오픈AI 임원도 내부적으로 AGI에 도달할 수 있는 방법을 찾았다고 느끼고 있으며, 가까운 미래에 도달 가능하다는 의견을 피력하고 있습니다.
당연하게도 AGI 달성을 위한 레이스에는 막대한 투자가 필요합니다.
최근 프론티어 AI 기업들이 높은 밸류에이션으로 막대한 펀딩을 진행하고 있는 것도 이와 연계됩니다. 투자를 받아야 capex 투자 및 연구 개발 비용 충당이 가능하기 때문이지요
1) 오픈AI → 3,000억 달러 밸류로 400억 달러 펀딩 논의(소프트뱅크 참여, 스타게이트 프로젝트와 연결)
2) xAI → 750억 달러 밸류로 100억 달러 펀딩 논의
3) SSI(일리야 수츠케버) → 2월 초 200억 달러 밸류에서 상승한 300억 달러 이상 밸류로 10억 달러 이상 펀딩 논의 보도
4) 앤스로픽 → 600억 달러 밸류에 20억 달러 펀딩 보도(1월, Lightspeed Venture 주도) + 구글 10억 달러 추가 투자
단순하게 생각하면 프론티어 AI 기업이 엄청난 펀딩을 통해 투자를 계획하는 것은 인프라 수요에 긍정적입니다.
다만 추론 수요 상승을 대비해 Capex를 투자하는 빅테크와는 결이 약간은 다릅니다. 추론 서비스를 통한 수익화 측면과 내부 적용보다 '학습'에 포커싱되어있기 때문인데요
하지만 AGI를 달성한다면 파생되어 활용될 수 있는 분야는 더욱 확대될 수 있습니다.
AGI가 끝이 아닙니다. ASI(초지능) 레이스도 계속되겠지요. 수츠케버의 SSI가 아무런 프로덕트 없이 밸류가 높아지고 있는 것이 이를 반증합니다.
AI 생태계 확장은 인프라에서 서비스로 사이클이 한 바퀴 도는 것으로 끝나지 않을 것 입니다.
(2025/2/18 공표자료)
👍3❤1
Grok 3 iOS 앱 업데이트 페이지
: Reasoning, 이미지 생성, Deep Search 기능 포함
: 보이스 모드는 일주일 내 출시 예정이라는 머스크의 코멘트
: SuperGrok 플랜($30/월, $300/년) 추가 가능성
: Reasoning, 이미지 생성, Deep Search 기능 포함
: 보이스 모드는 일주일 내 출시 예정이라는 머스크의 코멘트
: SuperGrok 플랜($30/월, $300/년) 추가 가능성
👍5
Grok 3 벤치마크(Reasoning 기준)
: AIME '24(Math)
Grok-3 93점, Grok-3 mini 96점
vs o3 full 96.7점
: GPQA(Science)
Grok-3 85점, Grok-3 mini 84점
vs o3 full 87.7점
: LCB Oct-Feb(Code)
Grok-3 79점, Grok-3 mini 80점
: AIME '25(Math)
Grok-3 93점, Grok-3 mini 90점
: AIME '24(Math)
Grok-3 93점, Grok-3 mini 96점
vs o3 full 96.7점
: GPQA(Science)
Grok-3 85점, Grok-3 mini 84점
vs o3 full 87.7점
: LCB Oct-Feb(Code)
Grok-3 79점, Grok-3 mini 80점
: AIME '25(Math)
Grok-3 93점, Grok-3 mini 90점
👍3
xAI, Grok 3 출시 및 데모 주요 내용
: 컴퓨팅 파워의 중요성 강조. 콜로서스 클러스터는 GPU 20만개로 확장하는데 92일 소요
: Grok3 학습에는 Grok2 대비 10배 이상 거의 15배 컴퓨팅 활용. 1월 초 사전학습 완료. 아직 훈련 중
: Base 모델 기준 Gemini 2.0 Pro, Deepseek V3, Claude 3.5 Sonnet, GPT-4o 상회
: 챗 봇 아레나에서 chocolate 모델로 초기 Grok 3 테스팅. ELO 점수 1,400점(1위)
: Reasoning 모델 + TTC 기준 o3-mini-high 상회. o3 full과 유사(AIME 및 GPQA 벤치 기준). CodeForce는 공개 x
: DeepSearch 프로덕트로 Agents 기능 구현. 인터넷 및 X 기반 심층 검색. 고도의 연산력을 활용한 Big Brain 모드
: X 프리미엄+ 유저($22/월) 대상 제공. SuperGrok 구독 런칭
: Grok 3 API 몇 주 내 공개. 음성 모드는 네이티브 형태로 목소리 톤과 감정을 이해. Grok 3 풀 런칭되면 Grok 2는 오픈소스
: 음성 모드는 일주일 후 출시 예정(마지막 티저로 공개)
: 컴퓨팅 파워의 중요성 강조. 콜로서스 클러스터는 GPU 20만개로 확장하는데 92일 소요
: Grok3 학습에는 Grok2 대비 10배 이상 거의 15배 컴퓨팅 활용. 1월 초 사전학습 완료. 아직 훈련 중
: Base 모델 기준 Gemini 2.0 Pro, Deepseek V3, Claude 3.5 Sonnet, GPT-4o 상회
: 챗 봇 아레나에서 chocolate 모델로 초기 Grok 3 테스팅. ELO 점수 1,400점(1위)
: Reasoning 모델 + TTC 기준 o3-mini-high 상회. o3 full과 유사(AIME 및 GPQA 벤치 기준). CodeForce는 공개 x
: DeepSearch 프로덕트로 Agents 기능 구현. 인터넷 및 X 기반 심층 검색. 고도의 연산력을 활용한 Big Brain 모드
: X 프리미엄+ 유저($22/월) 대상 제공. SuperGrok 구독 런칭
: Grok 3 API 몇 주 내 공개. 음성 모드는 네이티브 형태로 목소리 톤과 감정을 이해. Grok 3 풀 런칭되면 Grok 2는 오픈소스
: 음성 모드는 일주일 후 출시 예정(마지막 티저로 공개)
👍7