Content Explore

AI Agents全栈技术框架综述与未来!

Published : 2025-03-29 Categories : Machine Learning Tags : LLM Agent
LLM Agents正在变得广泛传播,但它们并非轻易就能创造出来,需要许多组件协同工作。以
40+ 张图解
,探索
LLM Agents

主要组件

Multi-Agent框架、
以及
MCP
...

15种高级RAG技术:从预检索到生成全面提升RAG效果

Published : 2025-03-29 Categories : Machine Learning Tags : RAG LLM
本文主要由文章《15 Advanced RAG Techniques from Pre-Retrieval to Generation》总结并添加了一些自己的理解。
检索增强生成 (RAG) 是一种强...

一文彻底搞懂大模型 - Dify(Agent + RAG)

Published : 2025-03-29 Categories : Machine Learning Tags : Dify Agent
Dify
Dify 是一个用于构建 AI 应用程序的开源平台。
Dify融合了后端即服务(Backend as Service)和LLMOps理念。它支持多种大型语言模型,如Claude3、OpenA...

Qwen-VL系列多模态大模型技术演进-模型架构、训练方法、数据细节

Published : 2025-03-29 Categories : Machine Learning Tags : Qwen VL VLM
Qwen2.5B-VL-32B开源之际,记录一下Qwen-VL系列多模态大模型技术演进-模型架构、训练方法、数据细节,仅供参考。
系列模型的应用场景:
Qwen-VL:基础图像理解和对话。
Qwen2...

llama.cpp: GGUF格式及模型量化参数介绍

Published : 2025-03-29 Categories : Machine Learning Tags : llama.cpp gguf
GGUF格式介绍
GGUF

GPT-Generated Unified Format
)是推理框架
llama.cpp
中使用的一种专为大语言模型设计的二进制文件格式,旨在实现模型的快速加载和保存...

万字长文细说端侧大模型进展(综述)

Published : 2025-03-29 Categories : Machine Learning Tags : LLM
0. 引言
小伙伴们好,我是微信公众号《小窗幽记机器学习》的小编:卖炒米粉的小男孩。最近,智谱AI推出的智能体AutoGLM引起了广泛关注。随着测试的深入,用户对该产品需要将屏幕数据上传至云端所带来的...

全景解读 LLM 后训练技术

Published : 2025-03-29 Categories : Machine Learning Tags : LLM
这篇文章是以2025年2月的一篇综述论文为蓝本,对「LLM后训练技术」的全景讲解:
[2502.21321] LLM Post-Training: A Deep Dive into Reasoning...

万字长文全面解读YOLO的前世今生:从 YOLO-v1 到 YOLO-v12

Published : 2025-03-23 Categories : Machine Learning Tags : Yolo Image
引言
计算机视觉领域中,目标检测技术举足轻重,广泛应用于安防、自动驾驶等关键场景。其中,YOLO 系列模型表现最为卓越。
2015年,YOLOv1横空出世,此后十年,YOLO 系列持续迭代,各版本不断...

小米人工智能部 基于BERT的ASR纠错

Published : 2020-07-15 Categories : Machine Learning Tags : NLP BERT ASR Spelling Check
导读:
小爱同学是小米公司开发的智能语音系统,已广泛应用在手机、手环、音箱、电视等电子产品中,并支持闲聊、问答、语音控制等多种语音交互场景。语音系统中语音内容识别 ( ASR ) 的精准性,是影响智能...

深度学习模型压缩和加速

Published : 2020-07-03 Categories : Machine Learning Tags : 深度学习 模型压缩
一 前言
近年来深度学习模型在计算机视觉、自然语言处理、搜索推荐广告等各种领域,不断刷新传统模型性能,并得到了广泛应用。随着移动端设备计算能力的不断提升,移动端AI落地也成为了可能。相比于服务端,移动...