(오늘의 짤방: BIf you’re building an agent, or you’re simply curious about what’s happening under the hood with Codex, this is worth a look. via @@gabrielchua)
- 빅데이터/인공지능
- do-i-have-the-vram is a lightweight CLI tool that estimates exactly how much VRAM you need to run a Hugging Face model without downloading it first.
- OpenAI Codex CLI 내부 동작 분석: 에이전트 루프와 프롬프트 캐싱 전략 (openai.com)
- NotebookLM’s Last Gift: Data Tables Changes Everything
- Claude in Excel
- supermemory - Your AI second brain for saving and organizing everything that matters.
- “ROI 여전히 안갯속···기업 AI 투자는 계속” PwC
- 오픈AI, 챗GPT 광고 빠르면 내달 도입…“최후의 수단”이 현실로
- 수조 달러 몰린 AI 산업, 거품 붕괴 조건 다 갖춘 이유 8가지
- AI는 왜 쓸수록 불편한 기술이 됐나
- AI’S MEMORIZATION CRISIS
- 앤트로픽, 안전·윤리 강화한 새 ‘클로드 헌법’ 공개
- AI가 바꾸는 2026 커머스 미디어…‘구매자 중심’ 시대가 온다
- 구글, 지메일·포토 등 개인 데이터 활용한 AI 검색 실험 돌입
- 서비스나우의 선택, 단일 AI 전략을 넘어서다…오픈AI 협력의 배경은?
- 에이전틱 AI 제대로 준비하기···엔터프라이즈 아키텍처 핵심 체크리스트 3가지
- 천문학적인 빅테크 인프라 투자, ‘AI 불황’의 전조로 볼 수 없는 이유
- 환각 줄이고 비용 낮춘다, 기업 환경에 적합한 LLM 디스틸레이션 전략
- 2026년 디지털 트랜스포메이션, 더하기보다 빼기가 성패 가른다
- Tokuin - LLM 토큰 사용량 및 API 비용 추정용 Rust CLI 도구 (github.com/nooscraft)
- 클로드의 새로운 헌법 (anthropic.com)
- Sweep, 오픈 가중치 기반 1.5B 모델로 코드 ‘다음 편집’ 자동완성 지원 (huggingface.co)
- Qwen3-TTS 패밀리 오픈소스 공개: 음성 디자인, 클론, 생성 기능 제공 (qwen.ai)
- NeurIPS 2025 승인 논문에서 GPTZero가 100건의 새로운 환각 인용을 발견 (gptzero.me)
- vLLM 제작자들이 설립한 'Inferact', 오픈소스 추론 엔진 상용화 위해 1억 5천만 달러 시드 투자 유치 (techcrunch.com)
- 검색의 새벽을 기다리며: 검색 인덱스, 구글 판결, 그리고 Kagi에 미치는 영향 (blog.kagi.com)
- hf-mem is an experimental CLI to estimate inference memory requirements for Hugging Face models, written in Python.
- eBay, 사용자 약관 개정으로 ‘나 대신 구매’해주는 AI 에이전트 명시적 금지 (valueaddedresource.net)
- ChatGPT 사용시 당신의 뇌에는 인지 부채(Cognitive Debt) 가 축적됩니다 (media.mit.edu)
- Unrolling the Codex agent loop
- Inspired by AlphaGo, we propose PageIndex — a vectorless, reasoning-based RAG system that builds a hierarchical tree index from long documents and uses LLMs to reason over that index for agentic, context-aware retrieval.
- Empirical evidence of Large Language Model’s influence on human spoken communication
- Show GN: Ollama 기반의 epub 번역기 (github.com/j-jiseophan)
- We release Qwen3-TTS, a series of powerful speech generation capabilities developed by Qwen, offering comprehensive support for voice clone, voice design, ultra-high-quality human-like speech generation, and natural language-based voice control.
- 대학은 찾고, 학생은 피하고 ‘AI 글 숨바꼭질’…“평가 기준 바꾸자” - “배움의 과정 평가하는 틀 필요” 의견도
- MCP is Not the Problem, It's your Server: Best Practices for Building MCP Servers
- 산업 혁명보다 더 거대한 AI 변화에 대한 구글딥마인드 허사비스의 견해 : 블룸버그 (WEF 2026)
- Agent Skills vs. Rules vs. Commands
- Agent Skills vs. Rules vs. Commands vs. Subagents
- 인공지능 시대의 Slack: 금광 "맥락"을 독점하는 진짜 돈 버는 B2C 플랫폼 (ianpark.vc)
- Designing AI-resistant technical evaluations
- Anthropic이 성능평가 테이크홈 과제를 오픈소스로 공개 (github.com/anthropics)
- Show HN 게시물 비율은 증가하지만 점수는 하락 중 (snubi.net)
- Demystifying evals for AI agents
- Flash AI - Deploy autonomous voice agents. Powered by advanced RAG systems. Connects directly to your Vector DB and Knowledge Graph.
- 네이버 AI 전략 이끈 성낙호, 독파모 탈락 후 첫 발언…어떤 말 꺼냈나
- "AI로 공부하면 바보 된다"…OECD 보고서 충격
- AirLLM optimizes inference memory usage, allowing 70B large language models to run inference on a single 4GB GPU card without quantization, distillation and pruning.
- Agents 2.0: From Reactive Chatbots to Learning Machines
- MemU is an agentic memory framework for LLM and AI agent backends. It receives multimodal inputs (conversations, documents, images), extracts them into structured memory, and organizes them into a hierarchical file system that supports both embedding-based (RAG) and non-embedding (LLM) retrieval.
- 구글, 빅쿼리에 자연어 주석 기반 SQL 생성 기능 도입
- 챗봇 시대의 대학 시험 운영하기 (ploum.net)
- X, 추천 피드 알고리듬 공개 (github.com/xai-org)
- The Normalization of Deviance in AI
- Using LLMs at Oxide
- The Rise of the Cognitive Architect
- FLUX.2: Frontier Visual Intelligence
- Claude 4.5 Opus' Soul Document.
- Claude 4.5 Opus Soul Document(Prompt)
- Wikipedia:Signs of AI writing
- Zebra-Llama: Towards Extremely Efficient Hybrid Models
- Goose - your local AI agent, automating engineering tasks seamlessly
- 법무부, '민사·형사·범죄피해자' AI 법률서비스 개시
- Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models.
- 로컬 컴퓨팅으로 넘어가는 AI 추론···‘엣지 AI’ 트렌드 한눈에 보기
- The Assistant Axis: Situating and Stabilizing the Default Persona of Language Models
- Gerbil - 로컬 LLM 실행용 데스크톱 앱 (github.com/lone-cloud)
- "클로드 제일 잘 쓰는 나라 한국"…마케팅·코딩에 최다 활용
- GLM-4.7-Flash 모델 공개 (huggingface.co)
- 데이터 관리 방식이 달라진다···2026년 ‘뜨는 5가지, 지는 5가지’
- 오픈AI, 세레브라스와 초대형 계약 체결···AI 추론 인프라 확장 나서
- Why 90% Accuracy in Text-to-SQL is 100% Useless
- 딥 러닝을 이용한 자연어 처리 입문
- South Koreans now spend more on AI subscriptions than Netflix each month
- ChatGPT, 광고를 도입하고 접근성을 확대할 것 (openai.com)
- 인간에게서 관찰되는 LLM 문제들
- FLUX.2 [klein]: 상호작용형 시각 지능을 향하여 (bfl.ai)
- Humanizer - A Claude Code skill that removes signs of AI-generated writing from text, making it sound more natural and human.
- [단독] "中기술 갖다씁시다"…현대차 자율주행 수장 충격 발언 [출처:중앙일보] https://www.joongang.co.kr/article/25398512
- Handtrack.js is a library for prototyping realtime hand detection (bounding box), directly in the browser.
- AutoMem is a production-grade long-term memory system for AI assistants, achieving 90.53% accuracy on the LoCoMo benchmark (ACL 2024)—outperforming CORE (88.24%).
- The Evolution from RAG to Agentic RAG to Agent Memory - The journey from one-shot retrieval to persistent agent memory
- Transcriber - AI transcription without the cloud. An open-source web app powered by Whisper that lets you transcribe audio and video locally — private, fast, and developer-friendly.
- Claude Code with Anthropic API compatibility
- Open Responses - LLM간 호환을 위한 오픈 규격 (openresponses.org)
- TranslateGemma: A new suite of open translation models
- 모든 AI 프로젝트는 결국 에이전트가 된다 (allen.hutchison.org)
- 구글, ‘유니버설 커머스 프로토콜’ 공개…AI 에이전트 상거래 표준 제시
- “AI 거품이 꺼져도 버틴다” CIO들이 말하는 AI 투자 리스크 관리 해법
- AI 의료 활용 잇단 확대…오픈AI 이어 앤트로픽 ‘클로드 포 헬스케어’ 공개
- 애플과 구글 제미나이 협력, 현재까지 알려진 사실
- “언제 어디서가 문제” 양자 컴퓨팅을 바라보는 기업의 시각
- F/OSS 史唯: 우리는 LLM을 거부할 게 아니라 되찾아 와야 한다 (writings.hongminhee.org)
- Pocket TTS - A high-quality TTS with voice cloning that runs on CPU.
- “2026년은 에이전틱 AI 성장의 해” 조건은 CIO의 올바른 전략 수립
- 챗GPT, 웹 기반 무료 번역 서비스 공개…회원가입 없이 이용 가능
- AI 시대 더 중요해진 백과사전?···위키피디아, 아마존·미스트랄·퍼플렉시티 등과 계약 체결
- ‘국가대표 AI’ 1차 평가서 네이버·NC 탈락···“재도전 계획 없다”
- On the Theoretical Limitations of Embedding-Based Retrieval
- LangExtract is a Python library that uses LLMs to extract structured information from unstructured text documents based on user-defined instructions.
- Local AI OCR (v2.2.2) - An local, offline (after initial setup), portable OCR software that can process images and PDF files, using DeepSeek-OCR AI (running directly on your machine).
- The tool search tool enables Claude to work with hundreds or thousands of tools by dynamically discovering and loading them on-demand.
- 애플, Nvidia 와 TSMC 생산 용량 확보를 위해 경쟁중 (culpium.com)
- Ask HN: 로컬에서 RAG를 어떻게 구현하고 있나요? (news.ycombinator.com)
- Awesome AI Agents for Healthcare
- “AI 에이전트 도입 기업, 연말 쇼핑 매출 성장률 59% 높아” 세일즈포스
- 개발자 도구에서 업무 파트너로…앤트로픽, 코워커로 클로드 활용성 확대
- 중국 지푸AI, 화웨이 칩만으로 이미지 생성 모델 학습
- “모든 데이터가 똑같지는 않다” AI 성패 가를 데이터 전략의 과제
- 구글 "같은 질문 두번하는 것 만으로도 AI 답변 향상할 수 있어"
- LG AI연구원·SK텔레콤·업스테이지, 'K-AI' 1차 평가 통과
- [유미's 픽] "특혜는 없었다"…독자 AI 1차 평가 결과에 정부 '호평' 받은 까닭
- FrogMini is built on the Qwen3-14B transformer architecture with a maximum context length of 64k tokens.
- LLMs-local - list of awesome platforms, tools, and resources run for LLMs locally
- 구글 Gemini, 개인화 지능 기능 도입 (blog.google)
- 구글 UCP - 범용 상거래 프로토콜 (developers.google.com)
- Claude Cowork mode system prompt
- AI Powered Knowledge Graph Generator
- Open Claude Cowork
- TimeCapsuleLLM: 1800~1875년 데이터만으로 학습된 대형 언어 모델 (github.com/haykgrigo3)
- Anthropic이 서드파티 클라이언트 접속을 차단한 것은 실수였다 (archaeologist.dev)
- Dive into Time-Series Anomaly Detection: A Decade Review
- ‘다 잘하지만 깊이는 부족한’ 단일 AI 플랫폼, 해답은 스택 중심 사고
- Anthropic의 새로운 'Claude Cowork' 기능 심층 분석
- Weam is an open source platform that helps teams adopt AI systematically.
- Genie: Uber’s Gen AI On-Call Copilot
- Applying Embedding-Based Retrieval to Airbnb Search
- mytorch - Easily extensible autograd implemented python with pytorch API.
- Anthropic의 새로운 'Claude Cowork' 기능 심층 분석
- 애플, 구글의 Gemini로 Siri에 AI 기능 탑재 (cnbc.com)
- Anthropic: Claude Code를 이용해 Claude Code 경쟁 제품을 개발하는 행위 금지 (twitter.com/SIGKITTEN)
- LFM2-1.2B - LFM2 is a new generation of hybrid models developed by Liquid AI
- First impressions of Claude Cowork, Anthropic’s general agent
- Memvid is a portable AI memory system that packages your data, embeddings, search structure, and metadata into a single file.
- Anthropic 엔지니어링: AI 에이전트 평가(Evals)의 실용적 가이드와 방법론 (anthropic.com)
- AI Agents from Scratch
- LLaMA-Factory lets you train and fine-tune open-source LLMs and VLMs without writing any code.
- Reimagining LLM Memory: Using Context as Training Data Unlocks Models That Learn at Test-Time
- Under the Hood: Universal Commerce Protocol (UCP)
- Anthropic, 로컬 파일 시스템 제어 및 에이전트 워크플로우 'Cowork' 리서치 프리뷰 공개 (claude.com)
- 전 세계 AI 확산 가속, 디지털 격차도 함께 확대
- “딥시크 성장세, AI 접근성이 중요한 이유” MS, 2025 AI 확산 보고서 발표
- 지멘스-엔비디아, 제조업 혁신 나선다···”산업용 메타버스 구현 목표”
- 2026년 의료 AI, 단일 LLM 넘어 멀티 에이전트·도메인 특화 모델로 나아갈 이유
- The New Compiler Stack: A Survey on the Synergy of LLMs and Compilers
- Prompt caching: 10x cheaper LLM tokens, but how?
- 하드웨어
- RTX 5090 품귀 현상과 되살아난 그래픽 카드 대란
- “메모리 부족 2027년까지 장기화” DDR5 전환·HBM 급증까지 겹쳐
- 퀄컴서 GPU 설계 전문가 영입한 인텔···그래픽 사업전략 변화 예고
- Sony와 TCL의 파트너십이 TV 시장의 미래에 의미하는 것 (bloomberg.com)
- 애플 나노 텍스처에 대한 노트 (2025) (jon.bo)
- 인텔, 다시 경쟁 전면에 서다…팬서 레이크로 반격 시작
- I tried the next-gen Android XR prototype smart glasses, and these frames are ready for your close-up
- Chips for the Rest of Us
- 엔비디아가 불붙인 추론AI…낸드플래시 가격 2배 폭등
- 삶의 문장, 제어의 문법: CES에서 SDV를 다시 읽다
- 자동차 디스플레이로 확장된 VESA DisplayPort 생태계
- “NPU가 필수일까?” CES 2026을 뒤덮은 코파일럿+ PC의 역설
- “메모리 부족이 2026년 PC 시장 흔든다···내년까지 가격 인상” IDC 전망
- 엔비디아, HBM4 사양 상향 조정…삼성·SK하이닉스 누가 승기 잡나
- When XLA Isn't Enough: From Pallas to VLIW with Splash Attention on TPU
- DRAM·SSD 품귀, PC 시장까지 흔든다
- 모든 것은 컴퓨터다 (a16z.news)
- 2026년 이더넷 연합, 레인당 400G로 AI 네트워킹 다음 단계 준비
- Inside NVIDIA GPUs: Anatomy of high performance matmul kernels
- 읽을거리
(보너스: The Hidden Infrastructure Behind the Age of Advanced Packaging. via @Arronwei3n)
EOB

댓글 없음:
댓글 쓰기