[삼성 이영진] 글로벌 AI/SW
8.15K subscribers
1.35K photos
8 videos
1.68K links
삼성증권 글로벌 AI/SW 담당 이영진
Download Telegram
메타 AI, 24년 Wrap up 및 25년 전망. Llama4의 추론 기능과 에이전틱 시스템 언급
Llama 4 will have multiple releases, driving major advancements across the board and enabling a host of new product innovation in areas like speech and reasoning.

We also see significant opportunities next year for the creation of agentic AI systems with advanced reasoning.


https://ai.meta.com/blog/future-of-ai-built-with-llama/
오픈AI, 챗GPT macOS 데스크탑 앱 업데이트(Work with Apps, Day11)

: 음성과 텍스트를 통해 코딩(ex Xcode)및 노트 작성앱(ex Notion)과 연동

: 라이브 영상 소개에는 Tasks 데모도 언급되어 있으나 실제 시현 부재

영상: https://www.youtube.com/live/g_qxoznfa7E?si=clpyihIeu7zGwoqd
구글, Gemini 2.0 Flash Thinking 모델 공개

: 2.0 Flash의 속도와 성능 기반으로 생각을 통한 추론 능력 강화. 실험 모델이지만, Google AI Studi와 Vertex AI를 통해 API 형태로 제공

https://techcrunch.com/2024/12/19/google-releases-its-own-reasoning-ai-model/
오픈AI 알렉 레드포드(Alec Redford) 퇴사 발표

: 2016년 학부 졸업 후 23살에 오픈AI 합류 후 트랜스포머 기술 연구 주도

: GPT, GPT-2, CLIP, Whisper 논문 제1저자. DALL-E, GPT-3, PPO, Scaling laws, RLHF 등 주요 논문 공동 저자

: 퇴사 이유는 독립적 연구를 하기 위함. 퇴사 메시지에서오픈AI 포함 타 AI 개발자 콜라보 계획 언급 보도

https://www.theinformation.com/briefings/senior-openai-researcher-radford-departs
오픈AI, 12Days of OpenAI(Shipmas) 12일차 발표는 o3?

: 샘 알트먼의 어그로성 X 포스팅과. The Information 보도. o3는 Orion 모델 기반이며, o2는 영국 통신사와 저작권 문제로 건너뛰었다는 내용 포함

https://www.theinformation.com/briefings/openai-preps-o3-reasoning-model

Day 1 - o1 & 챗GPT Pro 요약
Day 2 - 강화 미세조정 기능 요약
Day 3 - Sora 요약
Day 4 - Canvas 요약
Day 5 - 챗GPT 애플 인텔리전스 요약
Day 6 - AVM 비전 및 산타 모드 요약
Day 7 - 챗GPT Projects 요약
Day 8 - 챗GPT 서치 요약
Day 9 - DevDay for 개발자 요약
Day 10 - 1-800-CHATGPT 요약
Day 11 - Work with apps 요약
오픈AI, o3 및 o3 mini 모델 초기 벤치마크 공개

: 코딩 및 수학 관련 SWE-bench, Codeforces, AIME 2024, GPQA Diamond 등 벤치마크에서 기존 모델 상회

: 특히 ARC-AGI Low 모드 76%, High 모드 88% 달성. 인간 평균 85%

: 현재 안전 테스팅 단계. o3 mini 25년 1월 말 대중 공개. o3는 이후

영상: https://www.youtube.com/live/SKBG1sqdyIU?si=1cNt6G-dE1uttUli
👍3
오픈AI, GPT-5 프로젝트 지연 관련 보도

: 오픈AI GPT-5(코드명 오리온)는 기존 모델보다 획기적 성능 향상을 목표로 18개월간 개발 중이나 일정 지연. 개발 과정에서 높은 비용과 기술적 문제 직면

: 고품질 데이터 부족에 따른 데이터 확보 및 직접 생성해야 하는 상황. 대규모 훈련에 소요되는 시간과 비용 이슈. 주요 인재 이탈, 경쟁사의 연구자 빼가기 등으로 프로젝트에 어려움 가중

: 코드,수학 문제 해결 등 새로운 데이터 직접 생성. 합성 데이터 활용 및 품질 관리. 추론 중심 접근법 채택 등으로 대응

: 오픈AI는 GPT-5 출시 일정에 대해 확신하지 못하며, 2024년 출시 가능성은 낮음. 추론 모델 기반의 오리온 개선 계획 진행 중

https://www.wsj.com/tech/ai/openai-gpt5-orion-delays-639e7693?st=GXr1bN&reflink=desktopwebshare_permalink
👍3
오픈AI는 20일(현지시간) 십마스(Shipmas) 마지막 날 발표를 통해 'o3' 모델 공개에 이어 안전한 언어 모델 구축을 위한 방법으로 신중한 정렬을 소개했다.

이 방법은 ▲추론 모델에게 인간이 작성하고 해석 가능한 안전 사양의 텍스트를 직접 가르치고 ▲답변하기 전에 이런 사양에 대해 '생각의 사슬(CoT)'로 추론하도록 훈련하는 것으로 구성됐다.

우선 광범위한 안전 교육에도 불구하고, 대형언어모델(LLM)은 자주 탈옥 공격의 희생자가 된다고 지적했다. 그 이유로 모델이 충분하게 추론하지 않고 즉시 응답하는 점을 들었다. 또 자연어로 안전 원칙을 학습하는 대신, 데이터 학습 중 많은 예제를 통해 안전 원칙을 추측해야 하기 때문이라고 전했다.

신중한 정렬은 이런 문제를 해결하기 위해 등장한 것이다. 모델에 안전 원칙에 관한 텍스트를 직접 가르치고, 모델이 답을 내는 시점에 이런 사항을 추론하도록 훈련하는 최초의 접근 방식이라는 설명이다.

특히 이 방식은 기존에 주요 사용된 인간 피드백을 통한 강화 학습(RLHF)이나 AI 피드백을 통한 강화 학습 등보다 뛰어난 결과를 보인다고 강조했다.

훈련 방법은 안전 관련 사항이 포함된 시스템 프롬프트가 포함된 데이터셋을 감독 미세 조정(SFT)과 강화 학습(RL)을 사용해 미세조정하는 방식이다. 합성 데이터를 사용하는 방법으로, 인간이 라벨링한 데이터에 대한 의존도를 낮출 수 있다는 설명이다.

오픈AI는 "o1이나 o3처럼 모델이 더 많은 지능과 자율성을 얻으면서 정렬 오류나 오용으로 인해 발생할 수 있는 잠재적 피해 규모가 극적으로 증가한다"라며 "신중한 정렬은 우리의 노력에서 가장 최근의 진전을 나타내며, 그 결과는 매우 고무적"이라고 말했다.

https://www.aitimes.com/news/articleView.html?idxno=166433
1
오픈AI, 연휴 기간 Plus 유저 대상 Sora 무제한 접속 발표
2
팔란티어 & 안두릴, 미국 정부 사업 입찰을 위한 컨소시엄 구성

: 기존 방위 계약자의 독점을 타파하고, 국방 경쟁력 확보 목표. 스페이스X, 오픈AI 등 기업 포함. 최종 발표는 빠르면 1월

+ 일론 머스크, 팔란티어 공식 계정 팔로우

https://on.ft.com/3ZJhxjU
3
마이크로소프트, MS 365 Copilot에 서드파티 AI 모델 추가 작업 진행

: MS 365 Copilot 비용 절감과 성능 향상을 위해 오픈AI 외 내부 및 서드파티 AI 모델 추가 작업 진행 보도

: GitHub 등 다른 사업 부문에서 앤스로픽 및 구글 모델 통합을 통해 오픈AI 의존도를 줄이고 있음

https://www.reuters.com/technology/artificial-intelligence/microsoft-works-add-non-openai-models-into-365-copilot-products-sources-say-2024-12-23/
👍3
xAI 시리즈 C 60억 달러 펀딩 오피셜과 많은 컴퓨팅 자원이 필요하다는 머스크

: a16z, Blackrock, Fidelity, Kingdom Holdings, Lightspeed, MGX, Morgan Stanley, OIA, QIA, Sequoia Capital, Valor Equity Partners, Vy Capital 등이 주요 투자자. 전략적 투자자로 Nvidia, AMD 참여. 인프라 확장 지원
💯4