[삼성 이영진] 글로벌 AI/SW
8.17K subscribers
1.36K photos
8 videos
1.69K links
삼성증권 글로벌 AI/SW 담당 이영진
Download Telegram
오픈AI, 안전성 테스트 축소 논란

: 파이낸셜 타임스(FT)는 오픈AI가 최신 AI 모델의 안전성 테스트에 투입하는 시간과 자원을 대폭 줄였다고 보도

: 과거 모델(GPT-4 등) 테스트에 수개월이 걸렸던 반면, 최근 모델(o3 등)은 며칠 만에 평가 진행

: 전문가들은 테스트 기간 단축으로 인해 모델의 잠재적 위험을 충분히 식별하고 완화하기 어려워졌다고 우려. 치열한 경쟁 속 신규 모델을 빠르게 출시하려는 압박감 때문으로 분석

: 오픈AI는 자동화 등으로 테스트 프로세스가 효율화 되었으며, 테스트 방법을 투명하게 공개하고 있고, 테스트 버전과 최종 버전이 거의 동일하다는 입장
👍4
오픈AI GPT-4.5 개발 과정 관련 유튜브 영상 요약

1. GPT-4.5에 대한 반응
출시 직후 예상보다 훨씬 긍정적인 반응을 얻음. 많은 사용자들이 GPT-4와는 확연히 다른 대화 품질을 체감했고, 그 차이를 설명하기 어려울 정도로 경험이 달랐다고 평가

2. 개발 기간과 준비 과정
GPT-4.5 훈련은 약 2년 전부터 시작. 새로운 컴퓨팅 자원을 염두에 둔 설계와 함께, 시스템·ML·데이터 전반의 광범위한 사전 테스트 및 리스크 제거 진행. 

GPT-4는 현재 소규모 팀(5~10명)으로도 재훈련 가능하지만, GPT-4.5는 여러 팀 간 협업이 필요한 복잡하고 방대한 프로젝트

3. 목표와 성과
내부 목표는 GPT-4보다 10배 더 ‘똑똑한’ 모델을 만드는 것. 실질적인 연산 성능 기준으로 이 목표를 달성한 것으로 평가

4 대규모 학습의 복잡성
대규모 학습에선 예측 불가능한 문제들이 자주 발생.하드웨어 오류나 미묘한 소프트웨어 버그가 치명적인 이슈로 이어질 수 있음.해결되지 않은 문제를 안고 훈련을 시작해야 하는 경우도 많아, ‘완전 해결 후 시작’과 ‘진행하면서 해결’ 사이의 균형이 중요.

5. torch.sum 버그 사례
학습 중 PyTorch의 기본 함수(torch.sum)에서 희귀한 데이터 의존적 버그 발생.불법 메모리 접근으로 심각한 불안정성 유발.이 문제를 해결한 후 훈련 안정성과 ETA(남은 시간)가 크게 개선되었고, 팀 사기도 향상

6. 데이터의 한계와 효율성
향후 모델을 10~100배 더 키우기 위해선 데이터량이 가장 큰 병목 요소. 단순히 컴퓨팅 파워가 아닌, 더 적은 데이터로 더 많이 학습할 수 있는 알고리즘이 관건.현 모델들은 인간 대비 매우 비효율적인 데이터 사용을 하고 있음

7. 시스템 설계와 병목
시스템 안정성, 내결함성, 네트워크 견고성은 대규모 훈련의 핵심 인프라 요소.공동 설계를 통해 자원 부담을 나눌 수 있지만, 메모리 대역폭과 네트워크 병목은 여전히 큰 제약.

8. 미래 훈련 방식
향후 수천만 개 GPU를 활용한 대규모 훈련도 예상됨.이는 기존처럼 완전 동기화된 방식이 아닌, 반동기화·분산형 훈련 방식으로 발전할 가능성 큼

9. 핵심 인사이트 – 사전학습과 스케일링 법칙
언어 모델은 비지도 학습을 통해 데이터를 압축하려 하며, 이는 패턴, 연결, 추상화를 인식하는 방식

스케일이 커질수록 test loss(압축 성능)가 예측 가능하게 향상되며,그 과정에서 예기치 못한 일반 지능의 징후도 나타남.

중요한 것은 단순 암기가 아니라, 진정한 일반화 능력이며, 이를 위해선 엄선된 테스트셋을 통한 검증이 필수.

https://www.youtube.com/watch?v=6nJZopACRuQ
👍43
일리야 수츠케버의 SSI 신규 펀딩 라운드에 구글과 엔비디아 참여 보도

: 이번 펀딩 라운드는 벤처 캐피탈 회사 Greenoaks가 주도. SSI의 기업 가치는 320억 달러로 평가
👍6
팔란티어, DOGE와 IRS 데이터 프로젝트 협력 보도

: 미국 국세청(IRS)의 모든 데이터를 통합 관리할 수 있는 “메가 API”를 개발 중

: IRS 데이터베이스를 하나의 API로 통합해 클라우드에서 데이터를 관리하고, 팔란티어의 Foundry를 통해 데이터 분석 및 AI 모델 활용 가능하게 하는 것이 목표
👏5👍4
샘 올트먼, 신규 업데이트 발표 시사
“이번 주에 여러분을 위한 좋은 소식들이 많이 준비되어 있습니다! 내일부터 시작합니다.”
👍3
[삼성 이영진] 글로벌 SW 헤드라인 (25/4/14)

■ 팔란티어, DOGE와 미국 국세청(IRS)의 모든 데이터를 통합 관리할 수 있는 메가 API 개발 프로젝트 협력

■ 샘 올트먼, 이번주 신규 업데이트를 시사하는 X 포스팅 업로드

■ 샘 올트먼, 곧 공개할 오픈 웨이트 모델이 프론티어 모델에 근접한 성능을 갖출 것이라 코멘트

■ 사라 프라이어 오픈AI CFO, 내부적으로 A-SWE로 부르는 에이전트 기반 소프트웨어 엔지니어 프로젝트 언급

■ 오픈AI 전 직원 12명, 일론 머스크가 제기한 소송에 동참하며 영리 법인 전환 반대 의견 피력

■ 오픈AI, 최신 AI 모델의 안전성 테스트에 투입하는 시간과 자원의 축소 보도

■ 챗GPT, 3월 글로벌 앱 다운로드 4,600만 건으로 전월 대비 28% 증가. 순위에서 1위 차지

■ 오픈AI, API 형태로 제공되는 일부 고급 모델에 대한 접근에 대한 조직 인증 절차 Verified Organization 도입

■ 마이크로소프트, 오하이오주의 10억 달러 규모 데이터센터 건설 프로젝트 일부 중단 및 속도 조절 결정 보도

■ 일리야 수츠케버의 SSI 신규 펀딩 라운드에 구글과 엔비디아 참여 보도. SSI의 가치는 320억 달러로 평가

■ 메타 Llama 4 Maverick, 허깅페이스 공개 버전으로 재평가한 결과 LM아레나 순위 32등으로 하락

■ 넷플릭스, 오픈AI 기술을 활용한 신규 검색 기능 테스트. 유저의 기분이나 분위기 같은 구체적 포현 기반 콘텐츠 추천

■ EU, X 유저의 데이터 설정이 동의 없이 xAI의 Grok 학습에 활용된 것에 대한 조사 착수

■ 바이트댄스, AI 챗 봇 Doubao가 탑재된 AI 스마트 안경 개발 보도

감사합니다.
👍1
오픈AI의 세번째 에이전트 A-SWE

안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.

주말 간 오픈AI 샘 올트먼 CEO의 TED 2025 컨퍼런스와 사라 프라이어 CFO의 GS 테크 서밋(3월 초 진행) 발표 내용이 AI 씬에서 화제가 되었는데요

공통적으로 Agentic Software Engineering이라는 주제가 강조되었습니다.

샘 올트먼은 소프트웨어 개발에서 또 한 번의 거대한 변화가 다가오고 있으며, 에이전틱 소프트웨어 엔지니어링이 핵심이 될 것이라고 언급했고

사라 프라이어는 오퍼레이터, 딥 리서치에 이른 오픈AI의 세번째 에이전트인 코딩 에이전트 A-SWE(Agentic Software Engineer)에 대한 코멘트를 했습니다.

A-SWE는 단순한 코딩 자동화가 아닙니다. 기존 깃허브 코파일럿이 개발자를 보조하는 도구였다면, 이제는 실제 개발자처럼 일하는 에이전트가 등장했다고 주장했는데요

유저가 엔지니어에게 주는 것 처럼 PR(Pull Request)를 제공하면, 에이전트는 전체 어플리케이션을 직접 설계 및 구현하고, 개발자들이 기피하는 QA(품질 테스트), 버그 수정, 문서화까지 스스로 수행할 수 있습니다.

또한 향후 기업들은 해당 도구를 통해 소프트웨어 개발 역량을 획기적으로 확대 할 수 있게 될 것이라고 말했습니다.

단순한 생산성 도약이 아니라, 소프트웨어 개발 방식 자체의 패러다임 전환이며, 스스로 코드를 짜고 테스트하고 배포하는 ‘디지털 동료’의 시대가 열리고 있다는 분석입니다.

소프트웨어 기업들의 다양한 에이전트 출시가 이어지고 있지만, LLM의 발전 트렌드와 유사하게 '쓸 만한' 에이전트는 코딩 분야에서 먼저 출현할 확률이 높습니다.

그렇다면 A-SWE는 언제 출시될까요? 상반기가 유력하다고 이야가되고 있지만, 샘 올트먼은 이번주 다양한 신규 업데이트 발표를 시사했고, 모델 경쟁 선두로 나선 구글도 코딩 특화 모델을 준비하고 있는 만큼 전격 공개될 가능성도 배제할 수 없습니다.

단순 기술 경쟁을 넘어 API 가격 하락 트렌드와 챗GPT의 제한적 확장성(요금제 변화의 어려움)을 고려하면 매출 성장을 위해서 에이전트 기능의 성공적 안착은 불가피해 보이네요

큰 그림에서는 최근 보고서에 언급 드린것 처럼 AI 코딩의 발전이 소프트웨어 생태계에 미칠 영향도 지속 확인이 필요합니다.

(2025/4/14 공표자료)
👍3
오픈AI 에이전트 연구원 Shunyu Yao의 「The Second Half」

요약
AI는 지금 ‘전반전’에서 ‘후반전’으로 접어들고 있음. 전반전은 모델과 학습 방법의 발전 중심이었고, 후반전은 문제 정의와 평가 중심의 시대

1. 전반전: 모델 중심의 시대

과거 AI의 발전은 대부분 새로운 학습 방법과 모델 개발에 집중. “Transformer”, “AlexNet”, “GPT” 등 획기적인 모델이 등장하며, 벤치마크 성능 개선. 주로 “어떻게 더 나은 모델을 만들 것인가?“에 초점

2. 후반전: 문제 정의 중심의 시대

이제는 강화학습(RL)이 일반화되고 다양한 작업을 하나의 레시피로 해결 가능. RL + 언어모델이 소프트웨어 개발, 창의적 글쓰기, 수학, 키보드/마우스 조작, 장문 질의응답까지 커버

“이 모델로 무엇을 해결할 수 있는가?”에서 “AI에게 무엇을 시켜야 하며, 어떻게 평가해야 하는가?”로 초점 변화. 제품 관리자(PM)처럼 문제를 정의하고 지표를 세울 줄 아는 역량이 중요

3. 후반전의 과제
“좋은 모델”을 넘어서 “좋은 문제 설정과 평가”가 AI 진화의 열쇠. 평가 지표가 부실하면 AI 진보도 왜곡. 앞으로는 AI 연구자가 아닌 ‘문제 설계자’로서의 사고 전환 필요

https://ysymyth.github.io/The-Second-Half/
👍4
NATO, 팔란티어 AI 전투 시스템 도입

: NATO 통신정보국과 협력해 Maven 기반 맞춤형 Maven Smart System(MSS) NATO 인수 마무리

: 생성 AI, ML, LLM을 활용해 정보 융합, 표적 식별, 전장 인식 및 작전 계획 지원. 지휘관의 신속한 의사결정을 도움

: 계약은 6개월 만에 체결된 것으로 NATO 역사상 가장 신속한 계약 중 하나. 시스템은 30일 이내에 실제 작전 투입 예정

https://shape.nato.int/news-releases/nato-acquires-aienabled-warfighting-system-
👍4
오픈AI, GPT-4.1 시리즈 발표

: GPT‑4.1, GPT‑4.1 Mini, GPT‑4.1 nano 모델로 구성. 챗GPT에서는 사용할 수 없고 API로만 제공

: 코딩 성능 강화, 최대 100만 토큰 컨텍스트 윈도우, 멀티 모달 이해력 항샹, 비용 효율성(4o 대비 26% 저렴), 24년 6월 학습 컷 오프

: GPT-4.1 - 고성능 모델. 복잡한 코딩 및 문서 분석 적합

: GPT-4.1 mini - GPT-4o와 유사한 성능 빠른 응답과 저비용. 4o 대비 83% 저렴

: GPT-4.1 nano - 가장 빠르고 저렴한 모델. 분류, 자동완성 등 초고속 및 저비용 중요 작업 적합

: API 가격
- 4.1, 인풋 $2 및 아웃풋 $8
- 4.1 mini, 인풋 $0.4 및 아웃풋 $1.6
- 4.1 nano, 인풋 $0.1 및 아웃풋 $0.4

: GPT-4.5는 7/14일부로 API 중단 예정

https://openai.com/index/gpt-4-1/
👍1
[삼성 이영진] 글로벌 SW 헤드라인 (25/4/15)

■ 오픈AI, GPT-4.1 시리즈 발표. GPT‑4.1, GPT‑4.1 Mini, GPT‑4.1 nano 모델로 구성. 챗GPT에서는 사용할 수 없고 API로만 제공

■ 오픈AI, 인간의 개입 없이 새로운 과학적 아이디어를 독자적으로 생성할 수 있는 최신 AI 모델 o3와 o4-mini를 출시한다는 보도

■ NATO, 팔란티어의 AI 기반 군사 시스템 Maven Smart System NATO 인수

■ 메타, EU 내 성인 사용자의 공개 콘텐츠를 AI 모델 훈련에 활용하는 계획 발표. 유럽 데이터 보호 당국의 검토 이후 재개

■ 구글 딥마인드, 돌고래의 소리를 분석하고 이해하는데 도움을 주는 AI 모델 DolhinGemma 개발

■ 마이크로소프트, 마인크래프트 게임 환경 기반 실시간 상호작용이 가능한 월드 모델을 구현하는 MineWorld 오픈소스로 공개

■ 바이트댄스, 영상 생성 AI 모델 Seaweed-7B 공식 발표. 최대 30초 길이 영상 생성. 멀티샷 영상 생성 및 다양한 스타일 지원

■ 알리바바 AI 어시스턴트 Quark(쿼크) 글로벌 MAU 1.5억 명으로 중국 AI 앱 중 1위. 바이트댄스 두바오가 1억 명, 딥시크는 0.77억 명

■ 허깅 페이스, 프랑스 휴머노이드 로봇 기업 Pollen Robotics 인수

감사합니다.
👍2
중국 AI 스타트업 Zhipu AI, 25년 IPO 계획

: CICC를 주관사로 선정해 10월까지 과창판 상장 신청 모표. 현재 기업 가치는 27.4억 달러

: 25년 3월 정부 기관 주도로 18억 위안 자금 조달. 알리바바, 텐센트, 샤오미 등도 투자

: 25년 1월 미국 상무부의 무역 제한 리스트 포함

: AI 모델 GLM 시리즈와 AI 에이전트 AutoGLM Rumination 등 보유
👍2
[삼성 이영진] 글로벌 SW 헤드라인 (25/4/16)

■ 오픈AI, 차세대 추론 모델로 거론되는 o3와 o4-mini가 다양한 과학 분야의 개념을 연결해 새로운 실험 방식을 제안하는 성능을 보유했다는 보도

■ 오픈AI, X와 유사한 소셜 네트워크 개발 보도. 초기 단계로 챗GPT 이미지 생성 기능 중심 프로토타입을 내부 테스트 중

■ 사라 프라이어 오픈AI CFO, 자사 추론 모델 o 시리즈가 세계 최고의 경쟁 코더라고 확신한다는 코멘트

■ 오픈AI, 안전성 평가 체계 ‘Preparedness Framework' 업데이트. 경쟁사가 고위험 AI 시스템을 적절한 안전장치 없이 출시할 경우 자사 안전 요구사항 조정 가능성 시사

■ 오픈AI의 신규 모델 GPT-4.1 시리즈가 안정성 보고서(시스템 카드) 없이 배포되어 투명성에 대한 우려. 프론티어 모델이 아니기 때문에 별도의 시스템 카드 공개가 없다는 입장

■ 오픈AI, AI 모델 평가 및 분석 플랫폼을 개발 스타트업 Context.ai의 공동 창업자 2인 영입

■ 오픈AI, 챗GPT 내 생성한 이미지를 관리하는 라이브러리 기능 추가

■ 일본 공정거래위원회, 모바일 검색 시장에서 반경쟁적 행위를 이유로 구글에게 시정 명령

■ 구글, 영상 생성 AI 모델 Veo 2를 Gemini Advanced에 통합. AI Studio에서도 사용 가능

■ 앤스로픽, Claude 내 Research 기능 추가와 구글 워크스페이스 통합 발표. Resaarch 기능은 Max, Team, Enterprise 플랜 대상 베타 서비스, 워크 스페이스 통합은 유료 유저 대상 제공

■ 앤스로픽, AWS 고객 대상 자사 AI 제품 도입 촉진을 위한 신규 팀 구성

■ 주커버그, 내부 메모에서 2018년 인스타그램 분할 방안 고려

■ 마이크로소프트, Copilot Studio에 Computer Use Agnet 도입. 데스크톱 및 웹 애플리케이션의 사용자 인터페이스(UI)에서 직접 작업을 수행하는 에이전트 구축 지원

■ 애플, Differential Privacy 접근법을 통해 실제 유저 데이터를 직접 수집하거나 전송하지 않고 AI 모델 성능을 개선시키는 훈련 방식 공개

■ 세일즈포스, Agentforce를 통해 지난 30일 간 APEX 코드의 20%를 자동 생성

■ 콰이쇼우, 영상 생성 AI 모델 Kling 2.0 업데이트

■ Figma, 노코드 AI 스타트업 Lovavle에게 Dev Mode라는 용어 사용 중단 경고장 발송. Figma는 24년 해당 용어를 상표 등록

■ 코어위브, NVIDIA Grace Blackwell 기반의 GB200 NVL72 시스템을 클라우드에서 본격적으로 운영하기 시작

감사합니다.
👍1
[반.전] 엔비디아, H20 수출 규제

안녕하세요. 삼성증권 문준호의 ‘반도체를 전하다’입니다.

시장 기대와 달리, 그리고 미국 내 생산 발표에도 불구, 결국 H20도 규제 대상이 되었습니다.

4월 9일, 미 정부는 H20 수출에 대해 라이선스가 필요하다고 통보했고, 이는 4월 14일부터 무기한 시행 예정이라고 합니다.

엔비디아 측은 1분기 실적에 55억 달러의 손실이 예상된다고 공시했습니다. 1분기 매출 가이던스 430억 달러의 12.8%에 달하는 금액입니다.

해당 소식에 시간 외 6% 급락 중인데요,

물론 이전부터 overhang으로 작용해 왔지만 컨센서스가 하향조정 될 가능성이 높아졌습니다.

매출 단에서는 rush order 수혜가 있었을 지언정, 손실은 재고에 대해 별도로 인식하기 때문입니다.

난무하는 악재 속, 이익 가시성만큼은 가장 우수하다는 믿음이 훼손될 수 있는 것이죠.

결국 5월 말 실적 발표에야 알 수 있겠지만, 단기적으로 가장 중요한 것은 두 가지입니다.

1) 내일 있을 TSMC 실적에서 CoWoS 관련 톤 - CoWoS는 AI칩 생산의 proxy이기에, CoWoS 수급과 증설에 대한 '톤'이 중요

2) 빅테크 업체들의 CAPEX 기조 - 관세와 이로 인한 매크로 불확실성과 AI 투자 축소 우려 부각


계속 업데이트 드리겠습니다.

감사합니다.

(2025/4/16 공표자료)
👍2