(오늘의 짤방: human in the loop via @samuel_wong_)
- 빅데이터/인공지능
- Google’s TurboQuant Compression May Support Faster Inference, Same Accuracy on Less Capable Hardware
- SuperGemma4 E4B Abliterated MLX
- Evaluating AI Agents in Practice: Benchmarks, Frameworks, and Lessons Learned
- Prompting Claude Opus 4.7 - 프롬프트 엔지니어링 완전 가이드
- AI는 인간 같은 일반 지능 아닌 ‘들쭉날쭉 지능’
- Gemini 3.1 Flash TTS - 자연어로 음성 스타일을 제어하는 차세대 AI 음성 모델 (blog.google)
- pi-autoresearch: Karpathy의 "AI 자율 실험" 아이디어를 범용화한 오픈소스 (github.com/davebcn87)
- Qwen3.6-35B-A3B: Agentic Coding Power, Now Open to All (qwen.ai)
- Cloudflare의 AI 플랫폼: 에이전트를 위한 추론 계층 (blog.cloudflare.com)
- Thoughtworks Technology Radar, Volume 34 공개 (thoughtworks.com)
- 에이전틱 엔진 최적화 (AEO) (addyosmani.com)
- AI 동시통역 시대 여는 딥엘···수요 확대 배경으로 ‘제번스 패러독스’ 제시
- 고객지원 챗봇 노린 ‘AI 토큰 무임승차’ 확산…기업 AI 예산 흔든다
- I use the ‘potato’ prompt with ChatGPT every day — here is how it finds the holes in my logic
- TweetyBERT parses canary songs to better understand how brains learn language
- Data Center Intelligence at the Price of a Laptop
- Phi-4-reasoning-vision and the lessons of training a multimodal reasoning model
- The debut of Gemini 3.1 Flash Live could make it harder to know if you’re talking to a robot
- 멀티 에이전트 AI의 병목, “에이전트 아닌 조정 인프라”
- AI 없이 보낸 일주일 “오히려 좋았던” 이유
- Token counting: claude-opus-4-6 vs claude-opus-4-7
- Awesome AI in Finance
- "챗GPT가 'HWP' 한글파일도 읽는다"…韓 공공 문서 활용 확대
- claude opus 4.7을 소개합니다 (anthropic.com)
- 로컬 LLM 생태계에는 Ollama가 필요하지 않다 (sleepingrobots.com)
- SuperGemma4 - 구글 Gemma 4 26B의 비검열/속도개선/양자화 모델 (huggingface.co)
- 보이지 않는 과금 기준 ‘토큰’…챗GPT·클로드 코워크·깃허브 코파일럿 구조 비교
- CC Workflow Studio - Design workflows on a canvas. Export as Markdown your AI agent already understands. No more prompt-guessing.
- mlx-tune - Fine-tune LLMs, Vision, Audio, and OCR models on your Mac SFT, DPO, GRPO, Vision, TTS, STT, Embedding, and OCR fine-tuning — natively on MLX. Unsloth-compatible API.
- Lightning Whisper MLX - An incredibly fast implementation of Whisper optimized for Apple Silicon.
- AI라는 사상 최대의 예술작품 도둑질
- oMLX - LLM inference, optimized for your Mac
- 스탠퍼드대 AI 보고서: AI 업계 내부자와 일반 대중 간 인식 차 심화. 이 기술로 힘과 수익 챙길 사람들과 실직 위기와 불안에 직면한 사람들의 차이 반영.
- Introducing dotLLM - Building an LLM Inference Engine in C#
- 에이전틱 x402, A to Z
- pip install torch 한 줄로 끝낸다 — Python 패키징의 오랜 숙제, 드디어 풀리나 (talkpython.fm)
- PPT Master — AI generates natively editable PPTX from any document
- AI 에이전트 벤치마크를 무너뜨린 방법과 그 다음 단계 (rdi.berkeley.edu)
- Chandra OCR 2 - Chandra OCR 2 is a state of the art OCR model that converts images and PDFs into structured HTML/Markdown/JSON while preserving layout information.
- MinerU-Diffusion: Rethinking Document OCR as Inverse Rendering via Diffusion Decoding
- dstack is a unified control plane for GPU provisioning and orchestration that works with any GPU cloud, Kubernetes, or on-prem clusters.
- 핵무기 시대 답습/능가하는 AI 군비 경쟁
- autoresearch-mlx - Apple Silicon (MLX) port of Karpathy's autoresearch.
- 영화 '레지던트 이블'의 그녀가 AI 개발자가 된 이유는? - 배우 밀라 요보비치, AI 메모리 도구 개발
- vmlx - Local AI Engine for Apple Silicon - Run LLMs, VLMs, and image generation models entirely on your Mac. OpenAI + Anthropic + Ollama compatible API. No cloud. No API keys. No data leaving your machine.
- 의미를 잃어 가는 학교 과제물 - 교육은 완전 자동화 문턱에 이르렀다-목표가 뭘까
- 자율주행 패권 경쟁… 미국, 규칙을 서두르다
- SuperGemma4-26B-Uncensored-Fast v2
- Kronos is the first open-source foundation model for financial candlesticks (K-lines), trained on data from over 45 global exchanges.
- mac code - Run models that don't fit in RAM on your Mac. $0/month.
- 구글이 공개한 AI 에이전트
- Muse Spark: 개인 초지능으로 확장하는 Meta의 멀티모달 추론 모델 (ai.meta.com)
- LG, 멀티모달 AI ‘엑사원 4.5’ 공개…”텍스트·이미지 동시 처리”
- Implementing a RAG system: Walk
- 이 문서에서는 BigQuery의 임베딩 및 벡터 검색을 간략하게 설명합니다.
- PersonaPlex: Voice and role control for full duplex conversational speech models
- 새로운 GEMMA 4 31B TURBO 런치!
- 앤트로픽·오픈AI·마이크로소프트 모두 같은 말…”에이전트, 꼭 필요할 때만 써라”
- 음성 AI 에이전트, 왜 파일럿 단계를 넘지 못하나
- LLM 도입 전 체크리스트 27가지
- Create Expert Content: Building Capabilities for a Multi-Agent System with Google ADK, MCP, and Cloud Run
- Show GN: legalize-kr 법령을 코드처럼, 판례도 코드처럼. 모든 법령과 판례는 Markdown 파일, 모든 개정과 판결을 Git Commit으로.
- Advisor Strategy
- Advisor 전략: Opus를 조언자로 활용해 Sonnet의 지능을 끌어올리기 (claude.com)
- Z세대는 AI 주도 미래 반길까 - 예전보다 덜 희망적이고 불안감 커져
- Claude Mythos Preview System Card의 한국어 종합 해설
- NVIDIA AITune is an inference toolkit designed for tuning and deploying Deep Learning models with a focus on NVIDIA GPUs.
- 가트너 “인프라·운영 관련 AI 프로젝트 28%만 성공…20%는 완전 실패”
- GLM-5.1: 장기적 과제 수행을 향한 진화 (z.ai)
- GoClaw: OpenClaw를 Go로 재구성한 멀티 에이전트 게이트웨이 (보안·성능 중심 재설계) (goclaw.sh)
- GBrain — 오픈소스 개인 지식 베이스 (github.com/garrytan)
- Awesome Voice Typing
- A로 인한 초유의 불평등 심화 막으려면
- huihui-ai/Huihui-gemma-4-E2B-it-abliterated - This is an uncensored version of google/gemma-4-E2B-it created with abliteration
- google/mcp - This repository contains a list of Google's official Model Context Protocol (MCP) servers, guidance on how to deploy MCP servers to Google Cloud, and examples to get started.
- Scaling Managed Agents: Decoupling the brain from the hands
- Newton is a GPU-accelerated physics simulation engine built upon NVIDIA Warp, specifically targeting roboticists and simulation researchers.
- LumberChunker is a method leveraging an LLM to dynamically segment documents into semantically independent chunks. It iteratively prompts the LLM to identify the point within a group of sequential passages where the content begins to shift.
- 토큰 비용이 연봉 넘는 시대 온다?···AI 에이전트 과금 폭증에 IT 업계 경고
- Gemma Multimodal Fine-Tuner
- TorchTPU: Running PyTorch Natively on TPUs at Google Scale
- legalize-kr-compiler - legalize-kr/legalize-pipeline으로 만들어진 .cache 디렉토리를 git으로 바꿔주는 컴파일러입니다. 이 프로그램은 법제처 API를 직접 호출하지 않고, 이미 존재하는 캐시만 입력으로 받습니다. API 응답 캐시는 여기에서 다운받으실 수 있습니다.
- Hyper-Extract - Smart Knowledge Extraction CLI: Transform documents into structured knowledge with one command
- Google, 실험적 에이전트 오케스트레이션 테스트베드 Scion 오픈소스 공개 (googlecloudplatform.github.io)
- 작은 언어 모델 GuppyLM으로 언어 모델의 작동 원리를 직접 체험하기 (github.com/arman-bd)
- Sam Altman이 우리의 미래를 통제할지도 모른다 – 그를 신뢰할 수 있을까? (newyorker.com)
- LM Studio Headless CLI와 Claude Code로 로컬에서 Google Gemma 4 실행하기 (ai.georgeliu.com)
- Agent responsibly - Vercel
- ‘인간 vs AI’ 글 첨삭 대결…200명 청중은 누구 손 들어줬나
- 기계는 괜찮아요. 나는 우리가 걱정됩니다. (ergosphere.blog)
- Apple, Arm Mac에서 Nvidia eGPU 사용을 허용하는 드라이버 승인 (theverge.com)
- LLM-Wiki - LLM을 활용하여 개인 지식저장소 구축 하기 (gist.github.com/karpathy)
- 감정적 표현이 AI 성능을 바꿀까? — 프롬프트 감정 프레이밍의 실제 효과 (arxiv.org)
- Mac mini에서 Ollama과 Gemma 4 26B 모델 설정 요약 (2026년 4월 기준) (gist.github.com/greenstevester)
- Claude, 이제 OpenClaw 같은 써드파티에서 구독 모델 사용 불가 (x.com/bcherny)
- Gemma 4 비주얼 가이드 (newsletter.maartengrootendorst.com)
- 하드웨어
- 엔비디아 루빈 GPU 공급 차질 우려…기업 AI 인프라 도입 일정 늦어지나
- 엔비디아 독주 속 균열 조짐…구글 TPU 전략 통했다
- “2026년 물량 전부 달라” 고객 몰린 AWS, 자체 칩 전략 가속
- 홈랩 2026 현황: 셀프호스팅 취미의 진화 (mrlokans.work)
- Apple의 우연한 해자: ‘AI 패배자’가 승자가 될 수 있는 이유 (adlrocha.substack.com)
- Pico Micro Mac (pico-umac)
- Several Mac mini and Mac Studio configs are now completely out of stock at Apple
- NASA가 Artemis II의 내결함성 컴퓨터를 구축한 방법 (cacm.acm.org)
- 닌텐도 Wii에서 Mac OS X 10.0(Cheetah) 구동 성공 (bryankeller.github.io)
- IBM Z에 Arm 얹는다…클라우드 이전 어려운 워크로드 겨냥
- 읽을거리
(보너스: 한국어의 게임 금칙어 씨발의 변이형 via @eye0_0ball)
EOB


