[삼성 이영진] 글로벌 AI/SW
8.16K subscribers
1.36K photos
8 videos
1.69K links
삼성증권 글로벌 AI/SW 담당 이영진
Download Telegram
오픈AI, o3 및 o3 mini 모델 초기 벤치마크 공개

: 코딩 및 수학 관련 SWE-bench, Codeforces, AIME 2024, GPQA Diamond 등 벤치마크에서 기존 모델 상회

: 특히 ARC-AGI Low 모드 76%, High 모드 88% 달성. 인간 평균 85%

: 현재 안전 테스팅 단계. o3 mini 25년 1월 말 대중 공개. o3는 이후

영상: https://www.youtube.com/live/SKBG1sqdyIU?si=1cNt6G-dE1uttUli
👍3
오픈AI, GPT-5 프로젝트 지연 관련 보도

: 오픈AI GPT-5(코드명 오리온)는 기존 모델보다 획기적 성능 향상을 목표로 18개월간 개발 중이나 일정 지연. 개발 과정에서 높은 비용과 기술적 문제 직면

: 고품질 데이터 부족에 따른 데이터 확보 및 직접 생성해야 하는 상황. 대규모 훈련에 소요되는 시간과 비용 이슈. 주요 인재 이탈, 경쟁사의 연구자 빼가기 등으로 프로젝트에 어려움 가중

: 코드,수학 문제 해결 등 새로운 데이터 직접 생성. 합성 데이터 활용 및 품질 관리. 추론 중심 접근법 채택 등으로 대응

: 오픈AI는 GPT-5 출시 일정에 대해 확신하지 못하며, 2024년 출시 가능성은 낮음. 추론 모델 기반의 오리온 개선 계획 진행 중

https://www.wsj.com/tech/ai/openai-gpt5-orion-delays-639e7693?st=GXr1bN&reflink=desktopwebshare_permalink
👍3
오픈AI는 20일(현지시간) 십마스(Shipmas) 마지막 날 발표를 통해 'o3' 모델 공개에 이어 안전한 언어 모델 구축을 위한 방법으로 신중한 정렬을 소개했다.

이 방법은 ▲추론 모델에게 인간이 작성하고 해석 가능한 안전 사양의 텍스트를 직접 가르치고 ▲답변하기 전에 이런 사양에 대해 '생각의 사슬(CoT)'로 추론하도록 훈련하는 것으로 구성됐다.

우선 광범위한 안전 교육에도 불구하고, 대형언어모델(LLM)은 자주 탈옥 공격의 희생자가 된다고 지적했다. 그 이유로 모델이 충분하게 추론하지 않고 즉시 응답하는 점을 들었다. 또 자연어로 안전 원칙을 학습하는 대신, 데이터 학습 중 많은 예제를 통해 안전 원칙을 추측해야 하기 때문이라고 전했다.

신중한 정렬은 이런 문제를 해결하기 위해 등장한 것이다. 모델에 안전 원칙에 관한 텍스트를 직접 가르치고, 모델이 답을 내는 시점에 이런 사항을 추론하도록 훈련하는 최초의 접근 방식이라는 설명이다.

특히 이 방식은 기존에 주요 사용된 인간 피드백을 통한 강화 학습(RLHF)이나 AI 피드백을 통한 강화 학습 등보다 뛰어난 결과를 보인다고 강조했다.

훈련 방법은 안전 관련 사항이 포함된 시스템 프롬프트가 포함된 데이터셋을 감독 미세 조정(SFT)과 강화 학습(RL)을 사용해 미세조정하는 방식이다. 합성 데이터를 사용하는 방법으로, 인간이 라벨링한 데이터에 대한 의존도를 낮출 수 있다는 설명이다.

오픈AI는 "o1이나 o3처럼 모델이 더 많은 지능과 자율성을 얻으면서 정렬 오류나 오용으로 인해 발생할 수 있는 잠재적 피해 규모가 극적으로 증가한다"라며 "신중한 정렬은 우리의 노력에서 가장 최근의 진전을 나타내며, 그 결과는 매우 고무적"이라고 말했다.

https://www.aitimes.com/news/articleView.html?idxno=166433
1
오픈AI, 연휴 기간 Plus 유저 대상 Sora 무제한 접속 발표
2
팔란티어 & 안두릴, 미국 정부 사업 입찰을 위한 컨소시엄 구성

: 기존 방위 계약자의 독점을 타파하고, 국방 경쟁력 확보 목표. 스페이스X, 오픈AI 등 기업 포함. 최종 발표는 빠르면 1월

+ 일론 머스크, 팔란티어 공식 계정 팔로우

https://on.ft.com/3ZJhxjU
3
마이크로소프트, MS 365 Copilot에 서드파티 AI 모델 추가 작업 진행

: MS 365 Copilot 비용 절감과 성능 향상을 위해 오픈AI 외 내부 및 서드파티 AI 모델 추가 작업 진행 보도

: GitHub 등 다른 사업 부문에서 앤스로픽 및 구글 모델 통합을 통해 오픈AI 의존도를 줄이고 있음

https://www.reuters.com/technology/artificial-intelligence/microsoft-works-add-non-openai-models-into-365-copilot-products-sources-say-2024-12-23/
👍3
xAI 시리즈 C 60억 달러 펀딩 오피셜과 많은 컴퓨팅 자원이 필요하다는 머스크

: a16z, Blackrock, Fidelity, Kingdom Holdings, Lightspeed, MGX, Morgan Stanley, OIA, QIA, Sequoia Capital, Valor Equity Partners, Vy Capital 등이 주요 투자자. 전략적 투자자로 Nvidia, AMD 참여. 인프라 확장 지원
💯4
데미스 하사비스의 연말 코멘트에서 주목할 부분

: 2.0 Flash thinking - 우리의 첫 사고 모델. 곧 더 많은 소식이 있을 예정. 많은 분들이 기억하는 것 처럼 AlphaGo, AlphaZero, AlphaProof로 이러한 유형 모델 개척해왔음

: Willow - 10셉틸리온 년이 걸렸을 계산을 수행한 세계 최고 수준 양자 칩. 언젠가 AI 학습에 쓰일 수 있을 것
👍7
오픈AI - MS 파트너십 조건 재협상 & AGI 정의

: 10월부터 4가지 주요 사안에 대한 논의 진행 중. 1) 영리법인 지분 비율, 2) 독점 클라우드 제공 유지 여부, 3) IP 사용 권리 기간, 4) 매출 20% 공유 조건

: The Information 보도에는 양사 간 작년 협약에서 AGI를 초기 투자자에게 최대 1,000억 달러 수익을 창출할 수 있는 시스템으로 정의했다는 내용 포함

https://www.theinformation.com/articles/microsoft-and-openais-secret-agi-definition
2
올 한 해도 고생하셨습니다! 2025년 새해 복 많이 받으세요 😊
9👍4👏1
로건 킬패트릭 구글 AI 스튜디오 제품 책임자는 31일(현지시간) X(트위터)를 통해 "ASI로의 직행 가능성은 매달 높아지고 있다. 이것이 바로 일리야가 본 것"이라는 글을 올렸다. 일리야란 오픈AI에서 추론 모델의 기반인 '스트로베리', 즉 '큐스타'를 개발했던 수츠케버 전 최고 과학자를 말한다.

이어 수츠케버 전 최고과학자가 SSI를 설립한 뒤 중간 과정 없이 곧바로 ASI 개발에 착수한 것을 그 예로 들었다. "일리아는 중간 단계 모델을 내놓는 대신, ASI 구축으로 직행했다"라고 지적했다.

이에 대해서 "중간 모델 구축을 통해 추진력을 얻고 다른 기업과의 격차를 벌이는 과정없이 곧바로 ASI 구축에 도전하는 일리야의 방식에 대해 나를 포함해 많은 사람들은 처음에는 의구심을 가졌다"라고 말했다.

그러나 "일리야는 일찌감치 깨달았겠지만 '테스트-타임 컴퓨트' 확장을 단순하게 반복하는 것이 더 효과가 있다는 좋은 사례로 보인다"라고 설명했다.

즉, 일반적으로 사전 훈련을 통해 성능을 향상한 모델을 수년에 걸쳐 점진적으로 내놓는 방식보다, 한번의 사전 훈련 이후 테스트-타임 컴퓨트를 반복하는 것이 더 빠른 방법이라는 말이다. 수츠케버 SSI 창립자도 단번에 ASI를 구축하기 위해 이 방법을 채택했다는 설명이다.

이 말은 킬패트릭 책임자도 이 방식에 동의한다는 말로, 구글에서도 이미 이를 체감하고 있다는 말로 해석된다.

이어 인공일반지능(AGI)은 조만간 제품 형태로 등장할 것으로 봤다. 특히 최근처럼 첨단 성능을 갖췄다는 모델이 연이어 등장하는 과정에서 대부분은 이를 눈치채지 못할 것으로 봤다. 어느 날 "이것이 AGI"라며 등장하는 것이 아니라, 오픈AI나 구글 또는 다른 기업에서 경쟁적으로 모델을 출시하는 과정에 이미 AGI를 달성한 모델이 부분적으로 포함될 확률이 높다는 말이다.

이는 샘 알트먼 오픈AI CEO나 오픈AI 직원이 최근 밝힌 바와 비슷하다. AGI 개발이 눈앞에 와있다고 주장하거나, 이미 AGI를 달성했을 가능성이 있다는 내용이다. 단지 이를 일반인들은 잘 알아차리지 못할 뿐이라는 말도 나왔다.

https://www.aitimes.com/news/articleView.html?idxno=166671
👍61
[삼성 이영진] 글로벌 SW 헤드라인 (25/1/2)

■ 구글 AI 제품 책임자 로건 킬 패트릭, 테스트 타임 컴퓨트 기반으로 초인공지능(ASI) 달성 가능성이 매달 높아지고 있다고 코멘트

■ 오픈AI, 창작자 작품의 AI 훈련 제외 도구(Media Manager) 24년 출시 실패. 내부적으로 개발에 큰 비중을 두지 않았다는 보도

■ 노벨 물리학상 수상자 제프리 힌튼 교수, 오픈AI 영리법인 전환 반대 입장 표명

■ 바이트댄스, 수출 규제를 우회하여 중국 외부에서 엔비디아 AI 칩 확보에 최대 70억 달러 투자 계획

■ DeepSeek-V3, 자신이 오픈AI GPT-4 모델이라고 주장하는 사례 등장. GPT-4 생성 데이터 학습 추정

■ 영국 CMA, IBM의 해시코프 인수 관련 반독점 조사 개시

감사합니다.
👍2