AI Today

2026-04-03

오후 에디션

오후 7시

AI Weather

Gemma 4와 Qwen3.6-Plus 같은 오픈소스 멀티모달 모델이 급부상하고, AI 에이전트 연구가 활발해지는 하루.

에이전트
9
오픈소스
8
LLM
8
비전
5
하드웨어
4
규제
3

구글, Gemma 4 오픈소스 모델 공개 - 256k 컨텍스트와 네이티브 오디오 지원

Google DeepMind

구글이 새로운 Gemma 4 시리즈를 공개했습니다. Apache 2.0 라이선스로 완전 오픈소스이며 256k 컨텍스트 윈도우와 네이티브 오디오 처리를 지원합니다. 바이트 단위로 가장 뛰어난 성능을 자랑하며 고급 추론과 에이전트 워크플로에 최적화되어 있습니다.

gemmaopen-sourcemultimodal

Qwen3.6-Plus 발표 - 실제 에이전트 구현에 최적화된 새 모델

Qwen AI

알리바바가 Qwen3.6-Plus를 공개했습니다. 실제 환경에서 동작하는 AI 에이전트 구현에 특화된 모델로, 기존 대비 에이전트 태스크 성능이 크게 향상되었습니다. 다양한 도구 활용과 복잡한 추론 과정을 더 안정적으로 처리할 수 있습니다.

qwenagentopen-source

OpenAI, TBPN 인수 발표 - AI 에이전트 역량 강화 목표

OpenAI

OpenAI가 에이전트 기술 전문 업체인 TBPN을 인수했다고 발표했습니다. 이번 인수를 통해 자율적인 AI 에이전트의 계획 수립과 실행 능력을 대폭 강화할 예정입니다. GPT 시리즈와의 통합을 통해 더 정교한 에이전트 기능을 제공할 것으로 예상됩니다.

openaiagentacquisition

AMD, GPU와 NPU 활용한 로컬 LLM 서버 'Lemonade' 오픈소스 공개

AMD

AMD가 GPU와 NPU를 모두 활용하는 고속 로컬 LLM 서버 'Lemonade'를 오픈소스로 공개했습니다. 기존 CPU 기반 추론 대비 상당한 성능 향상을 제공하며, 로컬 환경에서 대규모 언어모델을 효율적으로 실행할 수 있습니다.

amdinferenceopen-source

구글, Gemini API에 비용-성능 최적화 기능 추가

Google AI Blog

구글이 Gemini API에 Flex와 Priority 두 가지 새로운 추론 티어를 도입했습니다. 개발자들이 비용과 신뢰성 사이의 균형을 애플리케이션 요구사항에 맞게 조정할 수 있게 되어, 더 유연한 AI 서비스 활용이 가능해졌습니다.

geminiapipricing

NVIDIA, Gemma 4 로컬 실행을 위한 RTX 가속 지원

NVIDIA AI

NVIDIA가 Gemma 4 모델의 로컬 실행을 RTX GPU에서 가속하는 기술을 공개했습니다. RTX 시리즈에서 에이전트 AI를 효율적으로 구동할 수 있게 되어, 클라우드 의존 없이도 고성능 AI 기능을 데스크톱에서 활용할 수 있습니다.

nvidiagemmalocal-ai

KiloClaw, 섀도우 AI 통제를 위한 자율 에이전트 거버넌스 툴 출시

AI News

KiloClaw가 기업의 섀도우 AI와 자율 에이전트를 통제할 수 있는 거버넌스 플랫폼을 출시했습니다. 기업 내에서 무분별하게 사용되는 AI 에이전트들을 중앙에서 관리하고 보안 정책을 적용할 수 있어, AI 리스크 관리에 새로운 해결책을 제시합니다.

governanceagentsecurity

중국, AI 배포 목표를 담은 15차 5개년 계획 승인

AI News

중국이 2030년까지의 AI 배포 목표를 상세히 기술한 15차 5개년 계획을 승인했습니다. 산업 전반에 걸친 AI 도입과 자국 AI 기술 육성에 대한 구체적인 로드맵을 제시하여, 글로벌 AI 경쟁에서 중국의 전략적 방향성을 명확히 했습니다.

chinaregulationstrategy

구글 Vids에 AI 동영상 생성 기능 추가 - Lyria와 Veo 기반

Google AI Blog

구글이 Vids에 AI 기반 동영상 생성 및 편집 기능을 무료로 추가했습니다. Lyria 음악 모델과 Veo 비디오 모델을 활용해 텍스트만으로 완전한 동영상을 생성할 수 있으며, 기업 사용자들의 콘텐츠 제작 효율성을 크게 높일 것으로 예상됩니다.

videogenerationworkspace

Mercor, LiteLLM 공급망 공격으로 보안 침해 당해

TechCrunch

AI 인재 매칭 플랫폼 Mercor가 오픈소스 LiteLLM 프로젝트 침해와 연관된 사이버 공격을 받았다고 발표했습니다. 이 사건은 AI 개발 도구의 공급망 보안 취약성을 부각시키며, 오픈소스 AI 인프라의 보안 강화 필요성을 시사합니다.

securitylitellmsupply-chain

오전 에디션

오전 7시

AI Weather

AMD의 로컬 LLM 서버가 화제를 모으고, Qwen과 Gemma의 멀티모달 에이전트 기술이 급부상하는 하루.

에이전트
8
LLM
7
오픈소스
6
비전
4
하드웨어
3
규제
2

Qwen3.6-Plus, 실용적인 AI 에이전트 개발에 최적화된 새 모델 공개

Qwen

알리바바가 Qwen3.6-Plus를 발표했다. 이 모델은 실제 환경에서 작동하는 AI 에이전트 구축에 특화되어 있으며, 기존 모델 대비 추론과 도구 사용 능력이 크게 향상됐다. 멀티모달 기능과 함께 에이전트 워크플로우에서의 안정성을 크게 개선한 것이 특징이다.

qwenagentmultimodal

구글, 온디바이스 멀티모달 AI 'Gemma 4' 출시

Hugging Face

구글이 차세대 온디바이스 AI 모델 Gemma 4를 공개했다. 텍스트, 이미지, 오디오를 동시에 처리하는 멀티모달 기능을 갖춰 스마트폰이나 개발자 워크스테이션에서도 고성능 AI 서비스를 구현할 수 있게 됐다. 프라이버시 보호와 오프라인 작동이 핵심 장점이다.

gemmamultimodalon-device

OpenAI, Codex 팀 요금제에 유연한 종량제 도입

OpenAI

OpenAI가 ChatGPT Business와 Enterprise 고객을 대상으로 Codex 사용량 기반 요금제를 새로 도입했다. 기존 고정 요금 대신 실제 사용한 만큼만 지불하는 방식으로, 팀 규모나 프로젝트 성격에 따라 더 유연하게 AI 코딩 도구를 활용할 수 있게 됐다.

openaicodexpricing

OpenAI, 딥러닝 연구 스타트업 TBPN 인수 발표

OpenAI

OpenAI가 딥러닝 연구에 특화된 스타트업 TBPN을 인수했다고 발표했다. TBPN은 신경망 아키텍처와 학습 효율성 연구로 주목받던 기업으로, 이번 인수를 통해 OpenAI의 모델 개발 역량이 더욱 강화될 것으로 예상된다.

openaiacquisitionresearch

KiloClaw, 기업용 AI 에이전트 거버넌스 플랫폼 출시

AI News

AI 보안 스타트업 KiloClaw가 기업 내 무분별하게 확산되는 '섀도우 AI'를 관리하는 자율 에이전트 거버넌스 도구를 공개했다. 이 플랫폼은 AI 에이전트의 행동을 실시간으로 모니터링하고 정책 위반 시 자동으로 차단하는 기능을 제공한다. 기업의 AI 리스크 관리가 주요 화두로 떠오르는 상황에서 주목받고 있다.

governanceagentsecurity

중국 15차 5개년 계획, AI 배포 목표 상세 발표

AI News

중국이 2030년까지의 AI 발전 로드맵을 담은 15차 5개년 계획을 승인했다. 이 계획에는 산업별 AI 배포 목표와 핵심 기술 개발 방향이 구체적으로 명시되어 있으며, 특히 자율주행과 스마트 제조 분야에서 글로벌 리더십 확보를 목표로 하고 있다.

chinaregulationpolicy

Sora 수익성 분석 결과, AI 비디오는 '돈 먹는 하마'

Substack

한 분석가가 OpenAI Sora의 수익성을 계산한 결과, 월 20달러 구독자 한 명당 65달러의 연산 비용이 든다고 밝혔다. AI 비디오 생성의 GPU 연산 요구량이 텍스트나 이미지 대비 기하급수적으로 높아 현 시점에서는 수익을 내기 어려운 구조라는 분석이다.

soraeconomicsvideo-generation

Experian 보고서, AI가 금융 사기 방지와 가해를 동시에

AI News

신용정보기관 Experian이 발표한 2026 사기 전망 보고서에 따르면, 금융기관이 AI를 사기 탐지에 활용하는 동시에 사기범들도 같은 기술로 공격을 고도화하고 있다. AI 기반 딥페이크 음성과 문서 위조 기술의 발전으로 금융업계의 AI 보안 전략 재검토가 시급한 상황이다.

securityfinancefraud-detection

LiteLLM 오픈소스 프로젝트 해킹으로 Mercor 서비스 피해

TechCrunch

AI 인재 매칭 플랫폼 Mercor가 오픈소스 LLM 프록시 도구인 LiteLLM의 보안 취약점을 통한 사이버 공격을 당했다고 발표했다. 이 사건은 오픈소스 AI 도구의 공급망 보안 중요성을 다시 한번 부각시켰으며, 기업들의 오픈소스 AI 도구 도입 시 보안 검토 강화가 필요하다는 목소리가 높아지고 있다.

securityopen-sourcesupply-chain

NVIDIA, 20년 개발한 CUDA Tile로 GPU 프로그래밍 혁신

Towards AI

NVIDIA가 20년간 개발해온 CUDA Tile 기술을 공개했다. 단 20줄의 Python 코드로 cuBLAS 성능의 90%를 달성하고 복잡한 스레드 관리 없이도 고성능 GPU 연산이 가능하다. 다만 NVIDIA가 컴파일러를 독점하고 있어 생태계 종속성 우려도 제기되고 있다.

nvidiacudagpu-programming