(오늘의 짤방: via @Catshealdeprsn)
- 빅데이터/인공지능
- Audiblez: Generate audiobooks from e-books
- GN⁺: Grok 3: The Bitter Lesson의 또 다른 승리 (thealgorithmicbridge.com)
- 퍼플렉시티, ‘검열-프리’ 딥시크 R1 변종 공개
- “어제 했던 말 기억하지?”··· 구글 제미나이, 대화 기억 기능으로 맞춤형 서비스 강화
- AI 여정의 걸림돌··· ‘레거시 앱’과 씨름하는 기업들
- Introduction to CUDA Programming for Python Developers
- GN⁺: Magma - 멀티모달 AI 에이전트를 위한 기초 모델 (microsoft.github.io)
- Open Deep Research
- Advanced Deep Research
- Today we're open-sourcing R1 1776, a version of the DeepSeek-R1 model that has been post-trained to provide unbiased, accurate, and factual information.
- Traditional RAG vs. HyDE, clearly explained (with visuals):
- MegaParse - 모든 유형의 문서를 위한 파서 (github.com/QuivrHQ)
- 구글, 제미나이 2.0 기반의 다중 에이전트 시스템 AI 공동 과학자 공개
- 종류별 특징만 알면 속지 않는다…AI 생성 콘텐츠 판별법
- SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features
- 생성형 AI로 ROI 실현 중··· 현장의 주요 활용 사례 4가지
- MS, 게임 개발용 AI 모델 ‘뮤즈’ 공개··· 7년치 게임 데이터로 학습
- D-FINE: Redefine Regression Task of DETRs as Fine‑grained Distribution Refinement
- DeepSeek R1 was just the start—this new Chinese research from @Kimi_Moonshot lets RAG AI agents devour entire codebases and documentation with no context limits.
- 머스크의 xAI, 검색과 추론 강화한 그록 3 발표
- AI 이니셔티브의 잠재력을 극대화하는 ML옵스 전략
- Open Multi-Agent Canvas is an open-source multi-agent chat interface that lets you manage multiple agents in one dynamic conversation.
- The AI CUDA Engineer: Agentic CUDA Kernel Discovery, Optimization and Composition
- Microsoft prepares for OpenAI’s GPT-5 model
- Open-Reasoner-Zero - An Open Source Approach to Scaling Up Reinforcement Learning on the Base Model
- Preswald - AI 데이터 앱을 위한 오픈소스 프레임워크 (github.com/StructuredLabs)
- Mastra - TypeScript AI 에이전트 프레임워크 (github.com/mastra-ai)
- MIT Godel Escher Bach Lecture
- Supavec - The open-source alternative to Carbon.ai. Build powerful RAG applications with any data source, at any scale.
- 구글 리서치, Gemini 2.0 기반 Co-scientist 발표 (research.google)
- Grok 3 Beta — The Age of Reasoning Agents
- 기업의 AI 도입 관행, ‘딥시크 등장 이후’ 무엇이 달라지고 있을까?
- 애플 인텔리전스의 지연과 애플이 직면한 압박감
- “뉴욕타임즈, AI 시대 변화 선언··· 기자 업무에 AI 전면 도입” 세마포
- 미스트랄, 아랍·중동 언어 모델 ‘사바’ 출시··· 전문가들 “지역 LLM 시장 성장세”
- 단기 성과와 장기 성장 사이··· AI 투자의 딜레마
- Introducing PaliGemma 2 mix: A vision-language model for multiple tasks
- OpenAI Deep Research의 문제점 (ben-evans.com)
- 파이썬 태서렉트 설치와 사용방법
- Perplexity, 공산당 검열 제거한 deepseek R1 AI 공개 (huggingface.co)
- 챗GPT가 쓴 글, 사람 글과 어떤 점이 다를까
- Andrej Karpathy의 Grok 3 얼리 억세스 리뷰 (x.com)
- 뉴욕 타임즈, 내부 AI 도구 `Echo`에 올인 (semafor.com)
- xAI, Grok 3 발표 (x.com)
- GN⁺: 생성형 AI 사기(Con) (wheresyoured.at)
- New GPT-4o Copilot code completion model available now in public preview for Copilot in VS Code
- AI Agents for Beginners - A Course
- How to Cut RAG Costs by 80% Using Prompt Compression
- merging Patterns in Building GenAI Products
- “버그가 아니라 특징” 정답을 모르는 생성형 AI의 딜레마
- “AI의 역설…인간 사고력 약화할 수도” 카네기 멜론∙MS 공동 연구
- Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention
- “연구기간 1년 10개월→1일로 줄여”··· LG생활건강, AI 모델 활용해 ‘화장품 효능’ 소재 개발
- “디지털화 시급하지만 현실은 지지부진”··· 제조업 임원들은 우려 중
- 새로운 위협 징후의 선제적 감지… 효과적인 ‘이상 탐지’ 구현법
- Flash Learn - 에이전트 LLM을 모든 파이프라인에 연동하기 (github.com/Pravko-Solutions)
- An End-to-End Framework for Production-Ready LLM Systems by Building Your LLM Twin
- Open-Interface: LLM으로 컴퓨터를 제어하기 (github.com/AmberSahdev)
- Using AI to decode language from the brain and advance our understanding of human communication
- OmniParser is a general screen parsing tool, which interprets/converts UI screenshot to structured format, to improve existing LLM based UI agent.
- SGLang is a fast serving framework for large language models and vision language models.
- 딥시크, LLM '추론 성능 향상법' 오픈 소스 공개..."코드 대신 자연어로 추론 훈련"
- 오픈AI의 딥 리서치와 지식의 가치 (번역)
- Competitive Programming with Large Reasoning Models
- For convenient OCR of PDFs through Gemni for non-programmers
- Synthetic Data of LLMs, by LLMs, for LLMs
- 공공분야 RAG 파이프라인 구축 연구
- Reasoning & Recursive Retrieval With Deepseek-r1, Tavily, and LangGraph
- GN⁺: OCR4all - 모두를 위한 OCR (ocr4all.org)
- 미국인 'AI 의존' 심하네…어느 정도인지 봤더니
- Mixture of Experts in DeepSeek V3 explained visually:
- Introducing the Model Context Protocol Java SDK
- Mechanism design for large language models
- PDF-Extract-Kit is a powerful open-source toolkit designed to efficiently extract high-quality content from complex and diverse PDF documents.
- 두돌 갓 넘긴 퍼플렉시티, '검색의 제왕' 구글 넘본다
- The Largest Sofa You Can Move Around a Corner
- GN⁺: AI가 신기술 채택을 저해함 (vale.rocks)
- New Gen AI paper🚨: "The Labor Market Effects of Generative Artificial Intelligence"
- zerox - A dead simple way of OCR-ing a document for AI ingestion.
- Company Researcher is a free and open-source tool that helps you instantly understand any company inside out.
- For years, I was hyperparameter tuning XGBoost models wrong. In 3 minutes, I'll share one secret that took me 3 years to figure out.
- Lightweight LLM for converting text to structured data
- Use GitHub Copilot in your IDE, on GitHub Mobile, or on GitHub.com for free.
- Learning New Data Science Skills, The Right Way
- Interesting! Deepseek added the offical prompts they use in their App/Webapp to the repository.
- 🐳 DeepSeek just dropped official recommendations on how to run their models effectively!
- OmniTool - Control a Windows 11 VM with OmniParser + your vision model of choice.
- AI-Youtube-Shorts-Generator - AI Youtube Shorts Generator is a Python tool designed to generate engaging YouTube shorts from long-form videos.
- Show GN: 대한민국 국내에 존재하는 지하철역 정보(역명, 지역구, 노선, 위/경도) 목록 (gist.github.com/nemorize)
- 📚 AI reads books: Page-by-Page PDF Knowledge Extractor & Summarizer
- KV caching is a technique used to speed up LLM inference.
- Reasoning best practices by OpenAI
- 생성형 AI 사용한 의사, 더 안전한 진료 결정 내려…BIDMC 연구
- 오픈AI, GPT-5에 o3 통합…AI 모델 전략 간소화
- Generative AI and Empirical Software Engineering: A Paradigm Shift
- Distillation Scaling Laws
- Langfuse is an open source LLM engineering platform.
- Zonos - 고품질 오픈 가중치 음성 합성 모델 (github.com/Zyphra)
- Fast-LLM is a cutting-edge open-source library for training large language models with exceptional speed, scalability, and flexibility.
- Researchers find the key to AI's learning power—an inbuilt, special kind of Occam's razor
- DeepSeek-R1 and exploring DeepSeek-R1-Distill-Llama-8B
- “임원 25%가 커뮤니케이션에 AI 활용 목표”··· 딥엘, 언어 AI 백서 발표
- 비영어 생성형 AI의 데이터 격차, 투명성과 비용 절감 이끌어낼까?
- AI 기업 로스 인텔리전스, 톰슨 로이터와의 저작권 소송에서 패소
- AI 에이전트 잘 쓰는 비법 있다··· ‘로우코드 교훈의 접목’
- 마이크로소프트가 딥시크를 두려워 하지 않는 3가지 이유
- “모두를 위한 AI?” 복잡한 모델 선택지가 초래한 아이러니
- 🤖 MedRAX: Medical Reasoning Agent for Chest X-ray
- Practical Deep Learning - A free course designed for people with some coding experience, who want to learn how to apply deep learning and machine learning to practical problems.
- Predictions for the Future of RAG¶
- OmniHuman - 사진 한장으로 실사 같은 영상을 생성하는 모델 (omnihuman-lab.github.io)
- GN⁺: DeepScaleR: RL을 활용한 1.5B 모델로 O1-Preview 능가하기 (pretty-radio-b75.notion.site)
- 딥시크보다 저렴하게 AI모델 개발한 LG…"국가차원서 알렸어야"
- LM2: Large Memory Models
- From PDFs to Insights: Structured Outputs from PDFs with Gemini 2.0
- maestro is a streamlined tool to accelerate the fine-tuning of multimodal models.
- contrastors is contrastive learning toolkit that enables researchers and engineers to train and evaluate contrastive models efficiently.
- 생성형 AI에 대한 과대광고가 궁극적으로는 순작용을 하는 이유
- "돈 버는 AI 증명하겠다"는 SKT, 에이닷도 연내 유료 구독 추진
- The Best Practices of RAG
- 더 나은 모델이 더 나은가? (번역)
- LLM을 ‘개발자를 위한 인플루언서’로 만드는 방법
- Huginn is a system for building agents that perform automated tasks for you online.
- Training Language Models to Reason Efficiently
- nano-graphrag - A simple, easy-to-hack GraphRAG implementation
- Andrew Ng released 'Agentic Object Detection' last week - here's why it's making waves
- Ingesting Millions of PDFs and why Gemini 2.0 Changes Everything
- In this post, we are happy to share the construction of OpenR1-Math-220k: our first large-scale dataset for mathematical reasoning!
- 알트먼 "AI 추론 비용 연간 10배씩 하락...하지만 인프라 투자 멈출 수 없어"
- GN⁺: Anthropic Economic Index (경제 지수) (anthropic.com)
- “이젠 엉뚱한 답도 거의 없다”...구글·오픈AI ‘오답률’ 1% 미만 진입
- How LLMs are secretly reshaping the code of tomorrow, and what to do about it
- “초당 1000단어 처리·업계 최고 수준 OCR 기술 구현”··· 미스트랄AI, ‘르챗’ 성능 높이고 유료화 본격화
- Embedding deduplication tool
- The Google Gen AI Python SDK v1.0.0
- Every Software as an Agent: Blueprint and Case Study
- OpenLLMetry is a set of extensions built on top of OpenTelemetry that gives you complete observability over your LLM application.
- Docling simplifies document processing, parsing diverse formats — including advanced PDF understanding — and providing seamless integrations with the gen AI ecosystem.
- R2R (Reason to Retrieve) is the most advanced AI retrieval system, supporting Retrieval-Augmented Generation (RAG) with production-ready features.
- Agency Is Frame-Dependent
- AI 창업자의 씁쓸한 교훈 (Bitter Lesson) (lukaspetersson.com)
- 새로운 AI 세상 - A New AI World (profgalloway.com)
- GN⁺: 현대의 예언자인가 아니면 헛소리 기계인가 - ChatGPT 세상에서 번영하는 방법 (thebullshitmachines.com)
- Goose - 오픈소스 AI 코딩 에이전트 (block.github.io)
- Chipper provides a web interface, CLI, and a modular, hackable, and lightweight architecture for RAG pipelines, document splitting, web scraping, and query workflows, enhancing generative AI models with advanced information retrieval capabilities.
- Spent 9,500,000,000 OpenAI tokens in January. Here is what we learned
- R1 Computer Use
- LLM Functions - This project empowers you to effortlessly build powerful LLM tools and agents using familiar languages like Bash, JavaScript, and Python.
- Train your own R1 reasoning model with Unsloth (GRPO)
- 🌐 Browser-use is the easiest way to connect your AI agents with the browser.
- 모두를 위한 LLM 애플리케이션 개발 환경 구축 사례
- Pathway is a Python ETL framework for stream processing, real-time analytics, LLM pipelines, and RAG.
- Midscene.js lets AI be your browser operator 🤖.
- (그 업무에) LLM이 꼭 필요할까?
- 구글, ‘가성비’ AI 모델 플래시라이트 공개··· 딥시크 견제
- Choosing the Right AI Agent Framework: LangGraph vs CrewAI vs OpenAI Swarm
- 하드웨어
- “조사한 우리도 깜짝 놀랐다”··· 레노버, 올해 한국 AI 지출 ‘6.2배 증가’ 전망
- 나만의 보급형 스마트폰 길 간다··· 아이폰 16‘e’ 한 글자가 말하는 애플의 전략
- AI 인프라 시장 고속 성장 지속··· 서버가 압도적 비중
- 기존의 SE는 잊어라··· 애플, 새로운 가성비 폰 ‘아이폰 16e’ 출시
- 애플, 아이폰 16e 출시…자체 5G 모뎀 C1 최초 탑재
- “손안의 100만 큐비트” 마이크로소프트의 야심 찬 양자 컴퓨팅 계획
- Apple, iPhone 16e 공개 (apple.com)
- GN⁺: Microsoft의 위상 큐비트(Topological Qubit) 관련 FAQ (scottaaronson.blog)
- GN⁺: Microsoft, 퀀텀 프로세서 'Majorana 1' 공개 (azure.microsoft.com)
- MS, 세상 뒤집을 양자 칩 공개... 수년내 AI 학습속도 100배
- 기업이 MR 헤드셋이 아닌 ‘스마트 글래스’를 선택하는 이유
- Arm, 자체 서버 칩 고객사로 ‘메타’ 확보··· 시장 영향은?
- USB 플래시 드라이브에 저장된 데이터는 얼마나 오래 갈까?
- 애플의 ‘ELEGNT’ 프로젝트가 제시하는 감성 로봇의 방향성
- 연이은 투자유치 '난항'…갑작스런 매각설
- OpenAI 홈페이지 개편 - "What can I help with?" (openai.com)
- GN⁺: Perplexity Deep Research 공개 (perplexity.ai)
- GN⁺: GPU에 대한 오해 (fly.io)
- GN⁺: 저예산으로 개인용 AI 컴퓨터 구축하기 (ewintr.nl)
- GN⁺: Game Bub - 오픈소스 FPGA 레트로 에뮬레이션 휴대기기 (eli.lipsitz.net)
- D램의 창신·낸드의 양쯔 … 숨은 고수들, 무협지처럼 등장
- “메타, 한국 AI 반도체 스타트업 ‘퓨리오사AI’ 인수 논의 중” 포브스
- 2024년 태블릿 출하량 9% 증가··· 4년 만에 반전
- 데이터센터 시장에도 중고사기 기승··· 5만 시간 사용한 HDD가 ‘신품’으로 둔갑
- 중국 CXMT, 삼전·하이닉스 위협..."과거 한국이 日 기업 몰아낸 방식"
- 키크론 B1 프로 리뷰 : 가격과 성능을 모두 잡은 슬림 키보드
- 다가오는 윈도우10 지원 종료··· AI PC 도입 물결에 순풍 될까?
- 읽을거리
(보너스: 힘들 때부터 진짜다. via @quente_egg)
EOB
댓글 없음:
댓글 쓰기