(오늘의 짤방: LLM-powered agent's anatomy via @tereza_tizkova)
- 빅데이터/인공지능
- pfl: Python framework for Private Federated Learning simulations
- OpenAI 챗봇 스토어가 스팸으로 가득 차고 있음 (techcrunch.com)
- ReverserAI is a research project designed to automate and enhance reverse engineering tasks through the use of locally-hosted large language models (LLMs).
- Binary and Scalar Embedding Quantization for Significantly Faster & Cheaper Retrieval
- Claude and ChatGPT for ad-hoc sidequests
- K-12 Prompt Engineering Guide
- the Patch Enhance Tool by Krea AI.
- MathVerse: Does Your Multi-modal LLM Truly See the Diagrams in Visual Math Problems?
- Daily Papers by HuggingFace
- 🚀 Devika - Agentic AI Software Engineer 👩💻
- The 01 Light is a voice interface for your home computer.
- "2030년 AI 글로벌 시장 규모 1800조...2023년 9배 달할 것"
- OpenAI의 Sora 모델 작동 원리 (factorialfunds.com)
- LLaVA-NeXT is recently merged to 🤗 transformers and it outperforms many of the proprietary models like Gemini on various benchmarks! 🤩
- 세일즈포스, "소매 기업 절반이 데이터 액세스 어려움 겪어"
- 애플이 비전 AI에 그토록 집중하는 이유
- SpeechBrain is an open-source PyTorch toolkit that accelerates Conversational AI development, i.e., the technology behind speech assistants, chatbots, and large language models.
- 🦍 RAFT: Adapting Language Model to Domain Specific RAG
- Thunder is a source-to-source compiler for PyTorch.
- 애플이 다윈AI를 인수한 4가지 이유
- 2024년 AI 성장통 3가지
- Jan is an open-source ChatGPT alternative that runs 100% offline on your computer.
- supervision - time analysis with computer vision
- “데이터가 있는 곳에서 쓴다” 머신러닝의 지각 변동 가져올 RoPPFL
- Computer-aided diagnosis for lung cancer screening
- How People Are Really Using GenAI
- Is Your AI-First Strategy Causing More Problems Than It’s Solving?
- Is RAG Really Dead?
- 7 methods to secure LLM apps from prompt injections and jailbreaks
- Getting Started With CUDA for Python Programmers
- Open Language Models (OLMos) and the LLM landscape - A small model at the beginning of big changes.
- AI cannot be used to deny health care coverage, feds clarify to insurers
- Anthropic의 프롬프트 라이브러리 (docs.anthropic.com)
- Building a RAG-Based Digital Restaurant Menu with LlamaIndex and W&B Weave
- Next.js AI Chatbot 2.0
- Fructose is a python package to create a dependable, strongly-typed interface around an LLM call.
- “공무원 위한 종합 AI 정책 필요해”··· 영국 감사원, 공공 AI 활용 방안 보고서 발표
- 의료 전문가가 애플 비전 프로에 주목하는 이유
- Magika is a novel AI powered file type detection tool that relies on the recent advance of deep learning to provide accurate detection.
- 프롬프트 엔지니어 회의론 증가..."알 필요가 없는 것까지 알아야 하는 느낌"
- LLM4Decompile - Reverse Engineering: Decompiling Binary Code with Large Language Models
- Inter-node and Intra-Node Networking Hardware
- Build an LLM RAG Chatbot With LangChain
- GN⁺: Youtube, AI를 이용해 만든 현실감 있는 동영상에 라벨링 요구 (blog.google)
- GPU memory and bandwidth comparison table
- awesome-data-labeling - A curated list of awesome data labeling tools
- Triton-Puzzles - This set is puzzles is meant to teach you how to use Triton from first principles in an interactive fashion.
- SCIN: A new resource for representative dermatology images
- 딥노이드 "영상 분석 넘어 '의료 LLM' 솔루션 도입...원격 의료 AI 구축할 것"
- 애플, 최강 성능 '이미지-텍스트' 모델 공개..."30B로 GPT-4·제미나이 능가"
- Machine Learning Engineering Open Book
- Simple Local RAG Tutorial(구글 노트북)
- Advanced RAG with Gemma, Weaviate, and LlamaIndex
- 더글러스 호프스태터: AI 번역의 시대, 더 늦기 전에 외국어를 배워야 한다
- nomic-embed-text-v1.5: Resizable Production Embeddings with Matryoshka Representation Learning
- OpenLLMetry is a set of extensions built on top of OpenTelemetry that gives you complete observability over your LLM application.
- AI 환각 현상 완화 트렌드 살펴보기
- 머스크 AI 기업 XAI, LLM 모델 ‘그록-1’ 오픈소스로 공개
- 가트너 "내년에 생성 AI '환멸의 골짜기' 찾아올 수 있어"
- Easily Train Models with H100 GPUs on NVIDIA DGX Cloud
- AutoDev: Automated AI-Driven Development
- How to Handle Imbalanced Data for Machine Learning in Python
- Skyvern – LLM 및 컴퓨터 비전을 활용한 브라우저 워크플로우 자동화 (github.com/Skyvern-AI)
- 🚀 RAG on Windows using TensorRT-LLM and LlamaIndex 🦙
- Racial bias in OpenAI GPT resume rankings
- 피어리뷰에 LLM이 얼마나 사용될까? 새 AI 생성 텍스트 감지 방법론
- Hackers can read private AI-assistant chats even though they’re encrypted
- Open Release of Grok-1
- EvalPlus is a rigorous evaluation framework for LLM4Code
- GN⁺: Getty 미술관, 약 8만 8천 점의 예술 이미지를 무료 사용으로 개방 (openculture.com)
- Spring AI RAG using Embedding Models and Vector Databases
- MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training
- Skyvern automates browser-based workflows using LLMs and computer vision. It provides a simple API endpoint to fully automate manual workflows, replacing brittle or unreliable automation solutions.
- Apple이 Multimodal LLM인 MM1에 대해 공개한 논문을 정리해 보았습니다. (discuss.pytorch.kr)
- 2조 날리고 매장 1000곳 '눈물의 폐점'…"중국에 당했다"
- GN⁺: IBM과 NASA, 과학 지식 접근성 향상을 위한 언어 모델 개발 (research.ibm.com)
- Scalene: a Python CPU+GPU+memory profiler with AI-powered optimization proposals
- 앤트로픽, 클로드 3 하이쿠 모델 발표 “절반의 비용, 3배의 속도”
- Better RAG 2: Single-shot is not good enough
- A little guide to building Large Language Models in 2024
- What I learned from looking at 900 most popular open source AI tools
- “AI는 그저 거들 뿐” 독일 법원, AI 이용해 업무 과부하 해소
- “2개의 뇌가 1개보다 낫다” AI 환각 현상 완화 트렌드 살펴보기
- Azure OpenAI's “Use Your Data” Feature Now Generally Available
- 머신러닝 애플리케이션에 GPU를 최대한 활용하는 법
- “아이디어화 기간 획기적으로 단축” IBM이 이미지 생성 AI를 활용하는 방법
- 생성형 AI 시스템이 바보가 되는 이유
- 소프트웨어 엔지니어 위협할 수도” 새 AI 개발자 비서 ‘데빈’에 쏠리는 관심
- 유럽의회, 세계 첫 AI 규제법 승인··· 기업에 미치는 영향은?
- GN⁺: Spreadsheets are all you need - 스프레드시트로 배우는 AI (spreadsheets-are-all-you-need.ai)
- Better RAG 1: Advanced Basics
- LearnOpenCV - This repo contains code for Computer Vision, Deep learning, and AI articles
- Knowledge Conflicts for LLMs: A Survey
- The Quantified Boolean Bayesian Network: Theory and Experiments with a Logical Graphical Model
- MultiHop-RAG: Benchmarking Retrieval-Augmented Generation for Multi-Hop Queries
- Magix - Magix is a mininalist toolkit for training LLM with flexible data and model parallel.
- GN⁺: Google SIMA - 3D 가상 환경을 위한 생성형 AI 에이전트 (deepmind.google)
- In my mind, automating software engineering will look similar to automating driving.
- Lost in the Middle: How Language Models Use Long Contexts
- models supported by OpenRouter
- Dataset: KoCommercial-Dataset (1.44M)
- Multilingual Embeddings for Wikipedia in 300+ Languages
- PromptBench: A Unified Library for Evaluating and Understanding Large Language Models.
- Real-time background removal w/ 🤗 Transformers.js
- I spent the last 2 weeks testing all the top models like GPT4, Claude, Mistral, Cohere, Gemini in various areas like:
- This model card corresponds to the 7B base version of the Gemma-Ko model. Gemma 한국어 학습 모델 등장
- Awesome Open-source Machine Learning for Developers
- Jailbreaking ChatGPT via Prompt Engineering: An Empirical Study
- GN⁺: Devin, 첫 번째 AI 소프트웨어 엔지니어 (cognition-labs.com)
- The Worst (But Only) Claude 3 Tokenizer
- TorchMultimodal is a PyTorch library for training state-of-the-art multimodal multi-task models at scale, including both content understanding and generative models.
- Bonito is an open-source model for conditional task generation: the task of converting unannotated text into task-specific training datasets for instruction tuning.
- This Python script allows you to download and process files from a GitHub repository, making it easier to share code with chatbots that have large context capabilities but don't automatically download code from GitHub.
- The Ultimate Guide to Data Wrangling with Python
- Algorithmic progress in language models
- Tour of Modern LLMs(and surrounding topics)
- The LLM Creativity benchmark
- Efficient Memory Management for Large Language Model Serving with PagedAttention
- On Preventing Hallucinations And Creating More Robust LLM Systems
- GN⁺: OpenAI, 트랜스포머 디버거 출시 (github.com/openai)
- Is Cosine-Similarity of Embeddings Really About Similarity?
- Databricks, Anyscale, Microsoft 에서 얻은 AI 인사이트들 (foundationcapital.com)
- Stealing Part of a Production Language Model
- Yi - 차세대 오픈소스 이중언어 LLM (github.com/01-ai)
- Building a product search API with GPT-4 Vision, Pydantic, and FastAPI
- When Simple RAG Fails (and how to fix it)
- Transformers-Tutorials - This repository contains demos I made with the Transformers library by 🤗 HuggingFace. Currently, all of them are implemented in PyTorch.
- What we learned in 6 months of working on a CodeGen dev tool GPT Pilot
- GPT Pilot is the core technology for the Pythagora VS Code extension that aims to provide the first real AI developer companion.
- Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context
- RAG Is Difficult and How To Get It Right
- VeCLIP: Improving CLIP Training via Visual-enriched Captions
- We present MOFI, a new vision foundation model designed to learn image representations from noisy entity annotated images
- 하드웨어
- “비즈니스에 진심” 신형 서피스, 제대로 된 업무용 디바이스로 업그레이드
- 젠슨 황 엔비디아 CEO, 삼성전자 부스 찾아 HBM3E에 ‘승인’사인 남겨
- 베네딕트 에반스의 애플 Vision Pro 한달 사용기 (ben-evans.com)
- 올드보이 개발자가 쓴 비전 프로 후기 시리즈 (medium.com/@jungkim)
- NVIDIA Blackwell Architecture Technical Brief - Powering the New Era of Generative AI and Accelerated Computing
- 경계현 삼성전자 사장 "내년 초 AI 가속기 '마하1' 출시"
- 존 그루버의 2023년 애플 성적표 (daringfireball.net)
- GN⁺: 소프트웨어 정의 라디오(SDR)로 할 수 있는 50가지 (blinry.org)
- 일류와 이류의 차이 (반도체 전설 짐켈러)
- 맥북에 삼성 프린터 연결하기
- 우리는 엔비디아의 시대에 살고 있습니다(上)[김성모 기자의 신비월드]
- 업데이트 후 USB 허브가 안 돼요” 맥OS 14.4의 USB 문제와 임시 해법
- 엣지 컴퓨팅을 과대포장하면서 동시에 무시하는 이유
- “결제하면 이미 늦었다” 노트북 구매 기준 5가지
- ‘AI, GPU, 그리고 집중’ · · · AMD 리사 수 SXSW 대담 요약
- “iOS 18에 에어팟 프로 ‘보청기 모드’ 추가된다” 블룸버그
- Awesome Local AI Tweet
- Chronos: Learning the Language of Time Series
- GN⁺: Nvtop - Nvidia/AMD/Intel GPU를 위한 리눅스 태스크 모니터 (github.com/Syllo)
- GN⁺: Meta의 GenAI 인프라 구축 (engineering.fb.com)
- 인텔 Gaudi 2 칩, Diffusion Transformer 벤치마크에서 Nvidia H100을 능가 (stability.ai)
- ‘반도체 전설’ 짐 켈러, AI 추론 전용 하드웨어 출시
- How to Build an Artificial Heart
- 읽을거리
- 노인 '고용불안'…실업급여 48% 늘었다
- 죽을 때까지 하지 말아야 할 101가지 일들
- 에이비일팔공-리머지, ‘2024 앱 마케팅의 현재와 미래’ 보고서 공동 발간
- [흥미돋]해외여행이 큰 경험이 아니라고 하는 이유 : 관찰하고 사유하지 않기 때문이라고 생각함
- 재테크, 지금도 늦었다. - 슈카월드 코믹스
- 자기자신과의 약속을 지켜나가다 보면 내가 지킨 약속들이 나를 지킨다
- 돈 없이 시작한 식품제조업, 법인설립, 그리고 성장..(2)
- 미국 아이비리그의 위기 - 미국 명문대는 비대하고 자만에 빠졌으며 리버럴하지 않다
- 이커머스 플랫폼의 다양한 수익 모델
- Hans Zimmer on Retirement: ‘Are You Kidding Me?’
- SNS에 가려진 대한민국 직장인들의 월급 평균
- “브랜드 아무리 잘 만들어도 상품이 꽝이면 망합니다”
- 한국만 들어오면 하향화? 한국에 럭셔리 호텔 없는 이유는… [호텔 체크人]
- 개인투자자의 해외증권투자 특징 및 평가
- 72년 산소통 안에서 살았던 ‘소아마비 폴’, 희망 주고 떠나다
- 금리 기조의 구조적 전환 가능성 평가 (II): 경제구조변화와 인플레이션
댓글 없음:
댓글 쓰기