(오늘의 짤방: Both Anthropic and Cursor realized, "filesystem is all you need" (alongside bash) via @NielsRogge)
- 빅데이터/인공지능
- Qwen3-VL-Embedding and Qwen3-VL-Reranker: For the Next Generation of Multimodal Retrieval
- Qwen3-VL-Embedding and Qwen3-VL-Reranker: A Unified Framework for State-of-the-Art Multimodal Retrieval and Ranking
- Qwen3-VL-Embedding & Qwen3-VL-Reranker
- 생성형 AI와의 경쟁, 해법은 신뢰성과 전문성
- “AI 효과는 크지만 성장 경로는 불확실” 경제학자의 솔직한 전망
- Demystifying evals for AI agents
- A toolkit for converting PDFs and other image-based document formats into clean, readable, plain text format.
- mcp-cli - A lightweight, Bun-based CLI for interacting with MCP (Model Context Protocol) servers.
- Introducing MCP CLI: A way to call MCP Servers Efficiently
- SAM-Audio is a foundation model for isolating any sound in audio using text, visual, or temporal prompts.
- 코파일럿 기반 워크플로우 재설계…J&Y 로펌·뱁슨 칼리지 사례로 본 성공 조건
- “모든 걸 하려다가 아무것도 못한다” AI 에이전트 프로젝트의 함정
- 유니버설 뮤직-엔비디아, 수백만 곡 음악 자산 활용해 AI 기술 협력
- 그록 미성년자 딥페이크 논란에도…xAI, 200억 달러 투자 유치
- OpenAI, ChatGPT Health 서비스 공개 (openai.com)
- 검진 결과 분석부터 식단 제안까지···오픈AI, ‘챗GPT 건강’ 선봬
- LLMs Reproduce Human Purchase Intent via Semantic Similarity Elicitation of Likert Ratings
- 아직은 어질어질··· AI 에이전트의 한계와 가능성은? [김태권·신호철의 ‘AI 비교 리뷰’]
- NIA가 전망한 2026년 12대 AI·디지털 트렌드 [28p PDF] (nia.or.kr)
- Building Voice Agents with NVIDIA Open Models
- Voice Agent With NVIDIA Open Models
- 앞으로의 앱은 틱톡처럼 소비되고 버려지게 될까.
- Quantized Retrieval - Binary Search with Scalar (int8) Rescoring
- LEANN is an innovative vector database that democratizes personal AI. Transform your laptop into a powerful RAG system that can index and search through millions of documents while using 97% less storage than traditional solutions without accuracy loss.
- Tiniest Durable Agent
- 해커뉴스 게시물의 65%가 부정적 감정을 띠며, 이들이 더 높은 성과를 보임 (philippdubach.com)
- 라즈베리 파이에서 실시간으로 구동되는 300억 파라미터 Qwen 모델 (byteshape.com)
- VideoRAG: Chat with Your Videos • Vimo Desktop
- 기업용 RAG는 왜 실패하는가…엔터프라이즈 환경에서 RAG를 확장하는 법
- LLM과 에이전트 이후의 AI, 비디오 언어 모델이 이끈다
- 왜 기존 미들웨어로는 부족한가, AI 시대를 위한 ‘마인드웨어’ 전략
- Unsloth-MLX - Fine-tune LLMs on your Mac with Apple Silicon
- 자율주행 롱테일 문제 해결을 위한 LLM 기반 추론 구조의 자율주행 적용 동향
- Train High, Infer Low - 머신러닝 학습과 서빙의 FP32, FP16, BF16, INT8 정밀도 선택
- AgentScope: Agent-Oriented Programming for Building LLM Applications
- Agentic AI Crash Course
- AI 시대에 꼭 알아야할 핵심 용어집 (168p PDF) (nia.or.kr)
- 🤖 Dialogue State Tracking (DST) 완벽 가이드
- gptme: 📜 Personal AI assistant/agent in your terminal, with tools so it can: Use the terminal, run code, edit files, browse the web, use vision, and much more;
- 긴 컨텍스트를 코드로 변환해 효율성 높이는 '재귀적 언어모델' 등장
- "AI 확장 시대 끝났다"…앤트로픽, 저비용·고효율 전략 승부수
- 맞불 작전: AI 음성 에이전트를 활용하여 구술시험을 확장하기 (behind-the-enemy-lines.com)
- 🤖 LangGraph Multi-Agent Swarm
- The Optimal Architecture for Small Language Models
- Z.AI Translation Agent: 6가지 전략 기반 AI 번역 서비스 기술 분석
- 아마존 CTO의 2026년 이후 기술 예측 (allthingsdistributed.com)
- The State of Production ML in 2025
- Apple’s M5 Max To Outperform NVIDIA’s Laptop RTX 5070 Ti In One Gaming Benchmark, According To Estimated Comparison, Up To 54% Faster Than M4 Max
- Tech Trends 2026 : 증명의 해(한국어 번역 버전)
- [유미's 픽] 고석현發 中 모델 의혹에 정부도 '움찔'…국가대표 AI 개발 경로까지 본다
- IMS Toucan - Text-to-Speech for over 7000 Languages
- 르쿤 "메타는 LLM에만 집중...퇴사는 정치적 이유 때문"
- 2025년의 편지 (danwang.co)
- Building internal agents
- 실리콘의 새벽, 원자의 무대 위에 서다 : 인텔 18A와 High-NA EUV가 열어젖힌 반도체 신세계
- 216만 원짜리 라벨링을 9만 원으로 줄이기 (na2ru2.me)
- 2025: The year in LLMs
- Advanced Prompt Engineering: Chain of Thought (CoT) - Comparing different techniques for reasoning
- 22GB SQLite에 백업한 해커뉴스의 2006–2025 전체 기사와 댓글 (hackerbook.dosaygo.com)
- 2025년 LLM 총정리: 추론·에이전트·코딩 에이전트의 해 (simonwillison.net)
- 中 AI 복사?…업스테이지, 공개 검증으로 돌파 "독자 기술 자신감"(종합)
- 국민 앞에 선 '국가대표 AI', 중간 발표로 확인한 K-AI의 현주소
- "AI가 오류 찾고 절세 팁까지" 더존비즈온 연말정산 솔루션의 진화
- OpenAI의 현금 소모는 2026년 거품 논쟁의 핵심 쟁점이 될 것 (economist.com)
- 🚨 RAG is broken and nobody's talking about it.
- AirLLM optimizes inference memory usage, allowing 70B large language models to run inference on a single 4GB GPU card without quantization, distillation and pruning.
- Build Your Own ML Framework - Don't import it. Build it.
- Agent Engineering: A New Discipline
- Build an LLM - This repository contains an educational training workflow for a transformer-based autoregressive, decoder-only language model.
- LLM Serving Architecture and the Economics of Inference Optimization.
- How to Use LLM as a Judge (Without Getting Burned)
- The State Of LLMs 2025: Progress, Problems, and Predictions
- KV Cache in Autoregressive Transformer Inference: Architecture, Scaling, and Optimization
- Tech Trends 2026 : 증명의 해 [49p 슬라이드] (drive.google.com)
- Use it or lose it - Let's make sure AI doesn't erode another core part of our skills.
- AI를 비용 낭비 없이 운영하기 위한 실전 통합 모범 사례 (thebootstrappedfounder.com)
- 우리는 어떻게 오락에 소통을 잃어버렸는가 (ploum.net)
- FastLanes – 차세대 빅데이터 파일 포맷 (github.com/cwida)
- Z80-μLM, 40KB 안에 담긴 ‘대화형 AI’ (github.com/HarryR)
- Google Ads는 죽었다. 이제 어디로 가야 할까? (circusscientist.com)
- 구글 "에이전트 많을수록 좋은 것 아니야...작고 체계화된 구조가 유리"
- AxonHub - All-in-one AI Development Platform
- OpenRouter의 AI 현황 보고서 : 100조 토큰 실증 연구 (openrouter.ai)
- Researching Tool Calling in On-Device AI
- 항상 텍스트에 베팅하라 (2014) (graydon2.dreamwidth.org)
- 조회수 630억·수익 1700억…‘AI 쓰레기’ 유튜브 잠식
- 구글 딥마인드: 더 팟캐스트 - 지능의 미래 | 구글 딥마인드 공동 창업자 겸 CEO 데미스 허사비스 대담
- 인공지능을 배우려고 시간을 낭비하지 마세요. 📘📚 온라인 자료 정리
- Lunar.dev is an open-source platform for managing, governing and optimizing third-party API consumption across applications and AI agent workloads at scale.
- 하드웨어
- CES 2026 현장 분석 : PC 생태계를 바꿀 핵심 기술
- Putting the “You” in CPU
- 엔비디아, 차세대 AI 플랫폼 ‘루빈’ 공개 “AI 토큰 비용 10분의 1로”
- 고밀도 환경 대응에 초점 맞춘 와이파이8, 2026년 출시 전망
- 공간·전력 한계 극복한다···DDR5 램 대안으로 떠오른 ‘소캠’
- 인텔, 18A 공정 기반 첫 프로세서 ‘코어 울트라 시리즈3’ 출시
- “엑사플롭 마케팅의 함정” 고성능 컴퓨팅 성능 기준 FLOP의 이해
- 델 XPS, CES 2026에서 부활…완성도와 성능 모두 업그레이드
- HP 엘리트보드 G1a, 새로운 폼팩터는 기회인가 IT 부담인가
- 인텔 칩 이름에 새로 붙은 ‘X’, 코어 울트라 시리즈 3 명명체계 해부
- 델, 소비자들은 AI PC에 관심 없다는 사실을 인정 (pcgamer.com)
- 삼성전자, 2026년 메모리 공급 부족 경고···전 산업 가격 급등 불가피
- 휴머노이드의 한계는 ‘보이지 않는 로봇’이 깨뜨린다
- CES 2026 현장 Q&A로 본 AMD의 라이젠 전략과 다음 행보
- CES 2026 최고의 노트북 10종
- Show GN: basic_RV32s: 오픈소스 RISC-V RV32I CPU 설계 길잡이 (github.com/RISC-KC)
- CES 2026, 노트북 성능은 더 빨라진다…가격 상승은 불가피
- GPU Cache Hierarchy: Understanding L1, L2, and VRAM
- SK하이닉스: 미국 패키징 시설로 TSMC의 독점에 도전하다
- Nvidia의 200억 달러 규모 반독점 회피 거래 (ossa-ma.github.io)
- AI가 메모리 칩을 대량 소비하면서 기기 가격이 상승할 것 (npr.org)
- State of GPU Hardware (End of Year 2025)
- 읽을거리


댓글 없음:
댓글 쓰기