오늘의 짤방: current state of stochastic parrot LLMs via @intrstllrninja
- 빅데이터/인공지능
- Jina Reader - Get LLM-friendly input from a URL or a web search. Improve the factuality of your agent, RAG, GenAI system with a simple prefix.
- Vision Foundation Models: When Does Size Matter?
- It’s easy to tamper with watermarks from AI-generated text
- It's surprisingly difficult for AI to create just a plain white image
- Temporal Data Meets LLM - Explainable Financial Time Series Forecasting
- Fine-tune a Llama-2 language model with a single instruction
- The lifecycle of a code AI completion
- Cody - Code AI with codebase context: "an AI pair programmer that actually knows about your entire codebase's APIs, impls, and idioms"
- MIT License text becomes viral “sad girl” piano ballad generated by AI
- After AI beat them, professional Go players got better and more creative
- AI's new power of persuasion: Study shows LLMs can exploit personal information to change your mind
- Stanford’s ReFT fine-tunes LLMs at a fraction of the cost
- Benchmark for general purpose AI chat model
- Effort - A possibly new algorithm for LLM Inference
- 50+ Open-Source Options for Running LLMs Locally
- AI shakes up corporate boards
- Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention
- Google’s new technique gives LLMs infinite context
- Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone
- ROC and AUC are important concepts for evaluating classification models in business (e.g. lead scoring). In 6 minutes, I'll share what took me 60 days to figure out.
- Multimodal Structured Outputs: GPT-4o vs. Other GPT-4 Variants
- “문서 처리 돕는 AI 도구, 98% 정확도 이르렀다” 세지윅 리아 쿠퍼 CDO
- 🧑🌾 DataGrower - Grow your own datasets
- 생성형 AI 전략 확장하는 애플, 아이폰 시리의 챗GPT 지원 논의
- “얼굴 표정, 손글씨도 인식…” 오픈AI, GPT-4o 발표
- I just updated my LLM performance chart. The chart now includes: • elo score • tokens per second • total cost(평가에 사용한 코드
- “생성형 AI와 검색의 결합” 정보의 디스토피아를 바꾼다
- 오픈소스 생성형 AI에서 주의해야 할 10가지 사항
- 비자, 고객 데이터 활용하기 위한 AI 계획 발표… 전문가 "소비자 이득 불분명"
- “적인가 동지인가” 마이크로소프트와 오픈AI의 복잡한 관계
- 생성형 AI의 개발 프로세스 이해하기
- 구글 I/O의 프로젝트 아스트라, 현실에 발 디딘 기술일까
- AI 데이터 플랫폼 기업 웨카, 1억 4천만 달러 투자 유치··· “생성형 AI로 수요 급증”
- 삼성SDS, 생성형 AI로 인천공항공사 업무 혁신
- OpenAI의 ChatGPT MacOS App 일부 사용자 대상 공개 및 출시 (help.openai.com)
- ‘제미나이의 시대’ 선언한 구글...121번 ‘AI’ 외쳤다
- With the Google Developer Program, you can now access new benefits at no cost - including Gemini - to generate summaries of documentation, explain sample code, & answer product Qs.
- Aichat: All-in-one AI-Powered CLI Chat & Copilot
- 머신러닝으로 만드는 개인화 추천 시스템
- How generative AI expands curiosity and understanding with LearnLM
- Yi 1.5 - 차세대 오픈소스 이중언어 LLM (github.com/01-ai)
- Open Source RAG with Ollama by Weaviate(Verba 1.0.0)
- GN⁺: 순수 NumPy로 구현하는 라마 3 모델 (docs.likejazz.com)
- Protecting users with differentially private synthetic training data
- Video-LLaVa is an open-source multimodal LLM trained by fine-tuning LlamA/Vicuna on multimodal instruction-following data generated by Llava1.5 and VideChat.
- Parler-TTS is a lightweight text-to-speech (TTS) model that can generate high-quality, natural sounding speech in the style of a given speaker (gender, pitch, speaking style, etc).
- A Watermark for Large Language Models(API 문서)
- Multimodal Augmentation for Documents: Recovering “Comprehension” in “Reading and Comprehension” task
- GN⁺: GPT-4o의 메모리 혁신 – 바늘 더미 속 바늘 (nian.llmonpy.ai)
- 미디어 산업을 감염시키는 AI 기반 콘텐츠 괴물, AdVon (futurism.com)
- 챗GPT 답변, 사용자 불만은… ① 질문 의도 오해 ② 깊이 부족 ③ 부정확[박재혁의 데이터로 보는 세상]
- 영상 편집, 음악 제작 등 창작자에게 필수 AI툴 개발 전쟁
- 생성형 AI를 활용한 비즈니스의 현주소
- 딥러닝 추천 모델에 인과추론 접목시켜 전환율 예측 성능을 향상시키자!
- Local RAG From Scratch - Develop and deploy an entirely local RAG system from scratch
- Binary Embeddings: All the AI, 3.125% of the Fat
- cuDF is a Python GPU DataFrame library (built on the Apache Arrow columnar memory format) for loading, joining, aggregating, filtering, and otherwise manipulating tabular data using a DataFrame style API in the style of pandas.
- pipecat is a framework for building voice (and multimodal) conversational agents.
- OpenAI CEO 샘 알트만 최근 인터뷰 ㄷㄷ
- Let's learn how to evaluate a RAG application (part 1):
- Punica: Serving multiple LoRA finetuned LLM as one
- LoRAX (LoRA eXchange) is a framework that allows users to serve thousands of fine-tuned models on a single GPU, dramatically reducing the cost of serving without compromising on throughput or latency.
- Start Building with Project IDX Today - Google I/O 2024 is in full swing, and we're sharing updates on how Project IDX fits into our mission to create an integrated workspace that can be used to ship full-stack, AI-powered apps across platforms.
- “틈날 때 부업, 수익 1000만원” 홍보의 진실
- GN⁺: Google DeepMind Veo - 가장 강력한 생성형 비디오 모델 (deepmind.google)
- Google I/O 2024에서 발표한 10가지 업데이트: 모든 웹 개발자를 위한 AI 기능 활용
- How GPT-4o predicts the next token 🎭
- Building Agents with gpt-4o
- Image Chat, Image Generation, Image classification and Normal Chat
- I got a fully working Breakout game code using a shortcut to pull up the app with GPT-4o and a simple screenshot of my screen.
- Using LlamaIndex and llamafile to build a local, private research assistant
- PaliGemma – Google's Cutting-Edge Open Vision Language Model
- Infinite Wonderland - This is an AI experiment where the timeless classic Alice’s Adventures in Wonderland is endlessly reimagined by artists, AI and you.
- Google I/O 2024에서 발표된 모든 것들 (theverge.com)
- Plot2Code: A Comprehensive Benchmark for Evaluating Multi-modal Large Language Models in Code Generation from Scientific Plots
- OpenAI Cookbook, interesting “The ChatCompletion endpoint now includes the ability to specify whether a tool must be called every time, by adding tool_choice='required' as a parameter.”
- Introducing GPT-4o: OpenAI’s new flagship multimodal model now in preview on Azure
- Introducing GPT-4o and more tools to ChatGPT free users
- 애플+오픈AI : Apple Intelligence 만든다
- How Is ChatGPT’s Behavior Changing Over Time?
- Understanding How Vector Databases Work!
- AI PROMPT ENGINEERING IS DEAD
- too long for a tweet, some thoughts on GPT-4o by Sam Altman
- Best practices for monitoring ML models in production
- 내가 StackOverflow에 시간과 전문 지식을 제공한 이유는 CC-BY-SA 라이선스 였기 때문 (aus.social)
- OpenAI, GPT-4o 공개 및 ChatGPT Free User에 더 많은 도구 도입 (openai.com)
- OpenAI, 텍스트, 오디오, 이미지 기능을 갖춘 멀티모달 AI 모델 GPT-4o 공개 (openai.com)
- 신한금융, 5년만에 '신한AI' 문 닫는다…"당국, 망분리 해결해야"
- ML & Gen AI for data teams - Building reliability by design for classical ML use cases and Gen AI
- nowledge Graph Builder App
- Neo4j for GenAI
- Query Knowledge Graph with LLM Application
- Lumina-T2X: Transforming Text into Any Modality, Resolution, and Duration via Flow-based Large Diffusion Transformers
- How to Build a Crystal Image Search App with Vector Search
- The Llama Hitchiking Guide to Local LLMs
- agentscope - Start building LLM-empowered multi-agent applications in an easier way.
- How LLMs Work, Explained Without Math
- LLM 추론 성능 엔지니어링: 모범 사례
- SolarLLMZeroToAll - 모두를 위한 #solarllm 시리즈
- LLaVA-NeXT: A Strong Zero-shot Video Understanding Model
- Trustworthy Retrieval-Augmented Generation with the Trustworthy Language Model
- Low-Hanging Fruit for RAG Search
- AutoGroq is an AI-powered conversational assistant designed to revolutionize the way users interact with AI tools.
- STORM: Synthesis of Topic Outlines through Retrieval and Multi-perspective Question Asking
- node-mlx - Node.js용 머신 러닝 프레임워크 (github.com/frost-beta)
- GN⁺: Stack Overflow 사용자들, OpenAI 제휴 후 답변 삭제 잇따라 (build5nines.com)
- 오픈AI, 시각 능력도 갖춘 AI 음성 비서 개발 중...프리뷰 공개 임박
- RadOnc-GPT: Leveraging Meta Llama for a pioneering radiation oncology model
- Natural Language Processing at UT Austin, 2023-2024 version (Greg Durrett)
- TimesFM (Time Series Foundation Model) is a pretrained time-series foundation model developed by Google Research for time-series forecasting.
- 오픈AI, 책임감 있는 AI 형성 위한 프레임워크 ‘모델 스펙’ 공개
- LiDAR Diffusion Models [CVPR 2024]
- 일랴가 존카맥에게 주었다는 30개의 페이퍼리스트.
- 현대오토에버 "딥러닝 기반 ETA 예측으로 내비게이션 정확도 74% 향상"
- IBM Granite - 코드 작성용 오픈 파운데이션 모델 패밀리 (github.com/ibm-granite)
- faster-nougat - Implementation of nougat that focuses on processing pdf locally.
- GN⁺: OpenAI, 콘텐츠 제작사와의 파트너십 제안 내용 자료 유출 (adweek.com)
- Scrapegraph-ai - LLM과 직접 그래프 로직을 이용한 웹 스크래핑 (github.com/VinciGit00)
- GN⁺: Google TimesFM - 시계열 예측을 위한 시계열 파운데이션 모델 (github.com/google-research)
- WrenAI is a text-to-SQL solution for data teams to get results and insights faster by asking business questions without writing SQL.
- “사내 자동화 도구가 새로운 수익원으로”··· 엑스피온헬스가 AI를 활용하는 방식
- 뒷방 신세 ‘빅데이터’ 유감 · · · 비즈니스와 데이터옵스의 간극에 대하여
- "생성형 AI 기업 배포 활발··· AI 채택의 최대 장애물은 ‘가치 입증’" 가트너
- "개인 AI는 순항 중, 전사 배포 전략은 헤매는 중"…MS 설문조사 결과
- [2024 금융AI 혁신①] '생성형AI'로 또 한번 격동… 은행권, 'AI 조직' 공격적 확대
- "식약처 점검에 답변 척척"…삼성바이오로직스, AI로 내부데이터 신속 검색
- What is retrieval-augmented generation, and what does it do for generative AI?
- "너무 모호해서 더 까다로운" LLM의 허점 5가지
- AI 도구가 '화상회의 피로'를 줄이는 데 도움이 될 수 있을까?
- '상담원의 업무 부담뿐 아니라'… 자체 개발한 생성형 AI 도구로 고객 지원 중인 UPS
- '책임감 있는 AI'에 대한 잘못된 통념 3가지
- Serverless RAG on AWS
- Fast Exact Retrieval for Nearest-neighbor Lookup (FERN)
- 🤗 LeRobot aims to provide models, datasets, and tools for real-world robotics in PyTorch.
- LMDeploy is a toolkit for compressing, deploying, and serving LLMs.
- Phi-3 WebGPU: a private and powerful AI chatbot that runs 100% locally in your browser
- How LLMs work, clearly explained:
- 세콰이어 캐피탈 주최의 AI 에이전트 관련 발표 중 두 개를 요약해 보았습니다.
- llama3.js - A JavaScript implementation of Llama 3 using node-mlx, code modified from mlx-examples.
- ImageInWords: Unlocking Hyper-Detailed Image Descriptions
- Exploring LLMs Speed Benchmarks: Independent Analysis
- 네이버, 웹 검색 AI 기술 업데이트…티스토리 영향?
- ML news of the week - A collection of the best ML news every week (research, news, resources). Star this repository if you find it useful.
- GN⁺: 2024년의 Machine Unlearning (ai.stanford.edu)
- GN⁺: gpudeploy - GPU를 위한 "에어비앤비" (gpudeploy.com)
- '소라'로 제작한 첫 공식 뮤비 공개..."뮤비는 만족할 수준"
- eSpeak NG - 100개 이상의 언어와 악센트를 지원하는 음성 합성기 오픈소스 (github.com/espeak-ng)
- Best tutorial on diffusion models that I’ve seen
- Secret Llama - WebGPU로 구동되는 인브라우저 Llama 3 챗봇 구현체 (github.com/abi)
- Top 10 Machine Learning Algorithms
- Amazon Q Developer 정식 버전 출시 – 개발자 경험을 변화시킬 신규 기능 추가
- Amazon Q Business 정식 버전 출시 – 생성형 AI 기반 업무 생산성 향상 지원 기능 추가
- Google's Med-Gemini Scores 91.1% on the US Medical Licensing Exam (USMLE) for M.Ds.
- 2DGS: 2D Gaussian Splatting for Geometrically Accurate Radiance Fields
- 마이크로소프트, SLM 넘어 매개변수 5000억개 규모 LLM도 자체 개발
- Machine Learning GPU Benchmarks
- llm.c, 이제 멀티GPU 트레이닝을 지원하며 PyTorch보다 ~7% 빠름 (twitter.com/karpathy)
- 인공지능에 필요한 배경지식 모음
- Autonomous RAG - This cookbook shows how to do Autonomous retrieval-augmented generation with GPT4.
- Scale AI just released their "AI Readiness" report
- DeepfakeBench: A Comprehensive Benchmark of Deepfake Detection (NeurIPS 2023 D&B)
- Best-of Machine Learning with Python - 🏆 A ranked list of awesome machine learning Python libraries. Updated weekly.
- Minimal Implementation of Rectified Flow
- spRAG is a RAG framework for unstructured data. It is especially good at handling challenging queries over dense text, like financial reports, legal documents, and academic papers.
- Introducing Idefics2: A Powerful 8B Vision-Language Model for the community
- NeuralForecast offers a large collection of neural forecasting models focusing on their performance, usability, and robustness. The models range from classic networks like RNN to the latest transformers: MLP, LSTM, GRU,RNN,TCN, DeepAR, NBEATS, NBEATSx, NHITS, DLinear, NLinear,TFT, Informer, AutoFormer, FedFormer, PatchTST,StemGNN, and TimesNet.
- Machine Learning cheatsheets for Stanford's CS 229
- Deep Factorization Machines
- A Primer on the Inner Workings of Transformer-based Language Models
- What makes Phi-3 so incredibly good?
- 🌟 Awesome LLM Apps - A curated collection of awesome LLM apps built with RAG and AI agents.
- Evidence of a predictive coding hierarchy in the human brain listening to speech
- Chapter 6: Finetuning for Text Classificatio
- 하드웨어
- 누피 에어 V2 리뷰 | 로우 프로파일 키보드의 위상을 높이다
- 엔비디아, “세계 최초의” 양자 가속 슈퍼컴퓨터 발표
- "과학 컴퓨팅서 큰 진전 기대"… 엔비디아, 블랙웰 플랫폼 사용 사례 공개
- 구글, 6번째 버전 TPU 칩 ‘트릴리움’ 공개
- GN⁺: Raspberry Pi Ltd, IPO 검토 (londonstockexchange.com)
- Pi-card is an AI powered voice assistant running entirely on a Raspberry Pi.
- GPUs Go Brrr
- From Papers to Pixels: a Raspberry Pi Document Scanner
- Announcing Trillium, the sixth generation of Google Cloud TPU
- 에어팟을 모스부호(Morse Code) 송신기로 사용하기 (github.com/EtherDream)
- “본체 꾹 쥐면 팔레트 표시” 애플, 애플 펜슬 프로 공개
- GN⁺: LPCAMM2 - 노트북용 모듈식, 수리 및 업그레이드 가능한 메모리 표준 (ifixit.com)
- NVIDIA GH200 Grace Hopper Superchip
- Apple, M4칩을 탑재한 신규 iPad Pro 및 Apple Pencil Pro 공개 (apple.com)
- Apple, M4 칩 공개 (apple.com)
- ‘바닷속 냉전’ 벌이는 美…해저케이블, 중국 안 거치고 간다
- Multi-million dollar Cheyenne supercomputer auction ends with $480,085 bid — buyer walked away with 8,064 Intel Xeon Broadwell CPUs, 313TB DDR4-2400 ECC RAM, and some water leaks
- 읽을거리
- 햇반 용기가 사각에서 동그라미로 바뀐 이유는
- '채권 듀레이션' 쉽게 공부하기 - 수정 듀레이션과 맥컬리 듀레이션은?
- 부동산·예금에 묶인 돈...답 없는 5060세대, 투자도 꼴찌
- Super Mario 64 fans finally open the game’s ‘unopenable’ door, 28 years later
- 중고 팔았는데 “세금 100만원”…리셀러 잡다가 민심 잡겠네
- [세쓸통]키 컸는데 뚱뚱해진 대한민국…30대男 40년만에 비만됐다
- 막막한 ‘현실의 벽’… 시동 꺼진 ‘푸드트럭’ [중고매물이 된 청년의 꿈 ①]
- 갑자기 코인 세금 고지서…"내년 아니었어?"
- [유머] 한국 전통 무협 만화 최신 근황. manga
- 밀리의 서재, 삼성·현대 등 ‘독서 고객사’ 매료…“비결은 ‘무제한 독서’”
- KB 연구 보고서(경제 관련 좋은 내용 많음)
- “수십년 일했는데 집 한 채만 덩그러니”…생활비에 허덕이는 '낀 세대'[현금없는세대 5060]
- Oasis refund fans almost £1m - After their disastrous Heaton Park gig, Noel and Liam Gallagher have sent out cheques to 20,000 disappointed fans – and are banking on them not being cashed in
- 일본 기프트 시장, 디지털이 대세
- 아마존에 취직한 인류학자
- 스탠리 드러켄밀러의 인사이트 15개
- [인터뷰] ING 강민주 "韓 주식은 신흥국, 채권은 선진국에 가깝다"
- 상비약 사러 갔다가 '깜짝'… 약값·병원비 껑충 뛰었다
- KDI 보고서 "한국의 중산층은 누구인가"
- Could stablecoin volumes overtake Visa this quarter?
- ‘다다익선’을 둘러싼 질문은 다다익선
- 낮은 출산율, 외롭지 않은 한국
- 3줄 요약 아니면 읽지 않는 시대
- Rockets and People - A four-volume memoir by Boris Chertok
- 영국에 포섭된 KGB 첩자, 1983년 미·소 핵전쟁 막았다
보너스: This hits home pretty hard... via @AartBik
EOB
댓글 없음:
댓글 쓰기