(오늘의 짤방: 고기를 얻는 데 엄청난 물을 사용한다고. 소를 키우는데 필요한 사료를 재배하기 위한 물 사용량까지 고려해서. 햄버거 하나 먹는거에 비해 ChatGPT 사용은 새발의 피라고. via @taekie)
- 빅데이터/인공지능
- 대화형 인공지능 종교의 출현 가능성
- 💫StarVector Models - StarVector is a multimodal LLM for Scalable Vector Graphics (SVG) generation, producing structured SVG code directly from images and text.
- GN⁺: OpenAI 오디오 모델 (openai.fm)
- “외국어 몰라도 된다?” AI 실시간 번역의 현재와 미래
- What Are Agentic Workflows? Patterns, Use Cases, Examples, and More
- GN⁺: 2025년에 어떤 AI 모델을 선택해야 할까? (creatoreconomy.so)
- VisionAgent is a library that helps you utilize agent frameworks to generate code to solve your vision task.
- [테크인사이드]AI에이전트가 온다...B2C 서비스 회사들의 딜레마
- This plugin for the llm package implements a model consortium system with iterative refinement and response synthesis.
- GN⁺: OpenAI o1-pro, 이제 API로 접근 가능 (platform.openai.com)
- Measuring AI Ability to Complete Long Tasks
- GN⁺: Claude, 이제 웹 검색 가능 (anthropic.com)
- “디지털 동료 개념, 현실화 중”··· CB인사이츠, AI 에이전트 시장 지도 제시
- GN⁺: AI Blindspots – AI 코딩 중에 발견한 LLM의 맹점들 (ezyang.github.io)
- RAG 필요 없이 LLM이 '자율 검색'하는 추론 기술 등장
- GN⁺: AI 에이전트가 무엇인지 아무도 모른다 (techcrunch.com)
- GN⁺: PDF에서 데이터 추출이 여전히 어려운 이유 (arstechnica.com)
- GN⁺: LLM의 시대에 "추천 시스템" 및 "검색" 개선방법 (eugeneyan.com)
- 구글 딥마인드, 로봇용 AI 모델 ‘제미나이 로보틱스’ 공개
- AI 추론 강화 향한 “급선회”··· 엔비디아 에이전트 AI 구축용 라마 모델 공개
- 어도비, ‘에이전트 오케스트레이터’ 공개··· AI 에이전트 관리 기능 강화
- This repository contains the implementation of the gemma PyPI package. A JAX library to use and fine-tune Gemma.
- Multi-vector embeddings (ColBERT, ColPali, etc.)
- ROC and AUC are important concepts for evaluating classification models in business (e.g. lead scoring).
- EXAONE Deep Released ━ Setting a New Standard for Reasoning AI
- We introduce EXAONE Deep, which exhibits superior capabilities in various reasoning tasks including math and coding benchmarks, ranging from 2.4B to 32B parameters developed and released by LG AI Research.
- Getting Started with cuML's accelerator mode (cuml.accel)
- “전문 심리 상담사보다 AI에 더 공감” 토론토 대학 연구팀
- “원하는 데이터에서 최적의 답 찾기” 생성형 AI 툴 4종 비교 분석
- “2024년 신차 4대 중 3대가 커넥티트 카··· 아직은 4G 연결이 94%”
- Cloudflare MCP Server
- GN⁺: 아마존이 로컬 Alexa 처리를 중단하고, 모든 음성 요청을 클라우드로 전송하기로 (theregister.com)
- LG AI Research EXAONE Deep 출시 (lgresearch.ai)
- 양자 컴퓨팅 경쟁 가속화··· 아이온Q·앨리스앤밥, 기술 성과 공개
- GN⁺: 딥러닝은 그리 신비롭거나 다르지 않다 (arxiv.org)
- A Visual Guide to LLM Agents: Exploring the main components of Single- and Multi-Agents
- Open-Source Handwritten Signature Detection Model
- LoRAX (LoRA eXchange) is a framework that allows users to serve thousands of fine-tuned models on a single GPU, dramatically reducing the cost of serving without compromising on throughput or latency.
- Open-R1: a fully open reproduction of DeepSeek-R1
- Open R1 - A fully open reproduction of DeepSeek-R1. This repo is a work in progress, let's build it together!
- codename goose - a local, extensible, open source AI agent that automates engineering tasks
- Block Open Source Introduces “codename goose” — an Open Framework for AI Agents
- AI Agentic Evaluation Tools Help Devs Fight Hallucinations
- How to Scale Your Model - A Systems View of LLMs on TPUs
- Constitutional Classifiers: Defending against universal jailbreaks
- Anthropic dares you to jailbreak its new AI model
- How DeepSeek ripped up the AI playbook—and why everyone’s going to follow its lead
- transformer lab - 100% Open Source Toolkit for Large Language Models: Train, Tune, Chat on your own Machine
- SMOL-GPT 🦾 - A minimal PyTorch implementation for training your own small LLM from scratch.
- How Gemini co-composed this contemporary classical music piece
- TinyZero is a reproduction of DeepSeek R1 Zero in countdown and multiplication tasks.
- GitHub Copilot: The agent awakens
- Computer Agent Arena | XLANG Lab
- GN⁺: 대규모 LLM의 가중치는 역사의 일부입니다 (antirez.com)
- Beautiful visualization of transformer outputs. Stunning visuals!
- GN⁺: Baidu, DeepSeek R1과 같은 성능을 내지만 가격은 절반인 모델 공개 (twitter.com/Baidu_Inc)
- GN⁺: RubyLLM - 루비스러운 방식으로 AI 작업하기 (github.com/crmne)
- Gemini 2.0 Flash Image Generation and Editing
- AutoAgent: Fully-Automated & Zero-Code LLM Agent Framework
- OCR4all - Optical Character Recognition (and more) for everyone
- A Survey on Post-training of Large Language Models
- My LLM codegen workflow atm
- 👨🏻💻 LLM Engineer Toolkit - This repository contains a curated list of 120+ LLM libraries category wise.
- Fine-tune & Run Gemma 3
- unsloth - Finetune Llama 3.3, Gemma 3, Phi-4, Qwen 2.5 & Mistral 2x faster with 80% less VRAM!
- 수세, AI 플랫폼 확장··· 워크로드 및 LLM 사용 제어 도구 추가
- 구글 딥마인드, 멀티 모달 AI 젬마 3 발표
- “AI 모델에도 종속은 위험” 딥시크라는 혁신의 의미
- The Transformer's encoder clearly explained 👇🏻
- The Transformers architecture clearly explained 👇🏻
- Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning
- Python과 함께하는 응용 데이터 사이언스 특화 과정 (coursera.org)
- GN⁺: 2025년의 데이터 검증 환경(Landscape) (aeturrell.com)
- GN⁺: 로컬 LLM을 활용한 이미지의 alt-text 생성하기 비교 (dri.es)
- The DeepSeek Series: A Technical Overview
- OpenAI Introduces Software Engineering Benchmark
- 안성 ‘에이전트’ 맞춤 워크플로우는?
- 경쟁 심화되는 AI 시장··· 오픈AI 새 API와 SDK로 차별화 나서
- 마이크로소프트의 생성형 AI 수익화 전략 : 고객을 압박하라
- New Gemini app features, available to try at no cost
- Mastering RAG - A comprehensive guide for building enterprise-grade RAG systems
- Tell your MacBook what to do, and it's done—across ANY app.
- Which Economic Tasks are Performed with AI? Evidence from Millions of Claude Conversations
- GN⁺: Google DeepMind의 Gemma 3 기술 보고서 [pdf] (storage.googleapis.com)
- 중국의 '여섯 마리 작은 용' (sixthtone.com)
- GN⁺: OpenAI Code Execution에서 C 와 JavaScript를 실행하게 만들기 (twitter.com/benswerd)
- Study: AI Search Engines Are Confidently Wrong Too Often
- (Ollama) gemma3 - The current, most capable model that runs on a single GPU.
- YOLOE: Real-Time Seeing Anything
- 최첨단 웹 스크래핑 기술들 (github.com/simonw)
- 거짓 정보 생성하는 AI를 바로잡는 해결책
- 챗GPT 프로 요금제 리뷰 | 월 200달러짜리 AI의 가치
- “생성형 AI 앱 및 에이전트 개발 간소화 역량 강화”··· 데이터브릭스, 신규 업데이트 발표
- OpenAI, AI 에이전트 개발을 위한 개발자 도구들 공개 (x.com/OpenAIDevs)
- Principal Component Analysis (PCA) is the gold standard in dimensionality reduction.
- GN⁺: Local Deep Research - 로컬에서 나만의 연구 조수 운영하기 (github.com/LearningCircuit)
- '우리 회사 서비스 캐릭터들이 AI를 만나면 어떤 아이들이 될까?' (feat. SKP 멀티 LLM 플레이그라운드 & AI 프롬프톤 사례 공유)
- Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models
- MS, 자체 추론 AI 모델 개발 지연··· 기술적 난관 외에도 인재 이탈설 나와
- GN⁺: Smart-turn - 오픈소스 오디오 턴 감지 모델 (github.com/pipecat-ai)
- GN⁺: 향후 10년은 AI 에이전트 이코노미의 시대가 될 것 (nfx.com)
- AI 에이전트 시장 지도 (cbinsights.com)
- 호텔 검색, 어떻게 달라졌을까요? 1편 - 문제와 해결
- 호텔 검색, 어떻게 달라졌을까요? 2편 - 지식 증류
- 호텔 검색, 어떻게 달라졌을까요? 3편 - 검색 시스템
- 호텔 검색, 어떻게 달라졌을까요? 4편 - 이미지 검색
- Apple의 '더 개인화된 Siri' 출시 내년으로 연기 (daringfireball.net)
- GN⁺: AI 도구가 연구 논문의 오류를 발견하고 있음 (nature.com)
- GN⁺: Microsoft는 OpenAI 없는 미래를 계획하고 있음 (techstartups.com)
- Stable Diffusion I — Mathematics Behind It
- Why Attention Is All You Need
- Demystifying Diffusion Models
- the current LLM "stack" is simultaneously being optimized in at least 10 different places:
- YTM (YouTube Transcripts Machine) is a web application that automatically extracts timestamps and transcripts from any YouTube video.
- AI Agents from Zero to Hero – Part 1 Build from scratch using only Ollama (no GPU, no APIKEY)
- Mac Studio Server Configuration for Ollama
- The State of LLM Reasoning Models Part 1: Inference-Time Compute Scaling Methods
- Awesome-GraphRAG (GraphRAG Survey)
- Model Context Protocol (MCP) 개발 방법 (wikidocs.net)
- 하드웨어
- 엔비디아, 데이터센터 GPU ‘RTX PRO 6000 블랙웰 서버 에디션’ 발표
- “엣지 컴퓨팅 2028년까지 연평균 13.8% 성장···· 리테일 및 서비스 부문이 최대 비중”
- Arm-암페어 모두 품은 소프트뱅크··· 서버 프로세서 시장에 미칠 영향은?
- 서버 지출 역대 최고 기록…기업 AI 도입이 성장 주도
- 엔비디아, 향후 3년간의 칩 전략 공개…FP4·HBM4로 AI 성능 극대화
- “썬더볼트부터 USB4까지” 휴대형 SSD를 위한 연결 기술 열전
- 엔비디아, 가속 양자 연구센터 설립··· “올 하반기부터 운영”
- 립부 탄 CEO 선임한 인텔··· 기업 IT 구매자에게 미칠 영향은?
- “기업 80%, 2025년 AI PC 도입” IDC
- “충전만 하기엔 너무 아까운” 아이폰 USB-C 포트 활용법 9가지
- I spent 250+ hours over 6 months working on the IO devices article.
- GN⁺: 아마존의 75만대 로봇은 무슨 일을 할까? (aboutamazon.com)
- “결정적 차이 없다” OLED 모니터라면 모두 좋은 이유
- PC에서도 콘솔처럼…나에게 딱 맞는 게임 컨트롤러 구매 가이드
- “레이벤 메타가 AI 스마트 안경 시장 열었다··· 2024년 글로벌 시장 210% 성장”
- GN⁺: 폭스바겐, 주요 기능에 물리 버튼 복귀 결정 (autocar.co.uk)
- 읽을거리
댓글 없음:
댓글 쓰기