从零打造B站视频自动解读:一条三级降级的内容提取流水线 需要自动提取B站视频的语音内容做摘要,但没有现成工具。参照已有的YouTube视频解读方案,用B站API + faster-whisper + GPU远程调用,从零构建了一条三级降级的提取流水线。 2026-06-05 技术实践 #bilibili #whisper #python #自动化 #音频转写
双卡2080Ti跑大模型:PCIe带宽是瓶颈吗?一次深度实测 玩本地大模型的玩家,几乎都会遇到一个灵魂拷问:双卡之间到底该怎么连?PCIe x4 够不够用?要不要上 NVLink?要不要换主板? 我的配置是两张 RTX 2080 Ti 22GB 魔改版,跑 Qwen3.6-35B-A3B(MoE 架构,35B 总参数,3B 激活),实测生成速度 105 t/s。这个速度在同类配置中算不错,但我一直想搞清楚:还能更快吗?瓶颈到底在哪? 2026-06-05 AI基础设施 #GPU #LLM #llama.cpp #性能优化 #RTX 2080 Ti #MoE #PCIe
双卡 GPU 显存分配策略——让 llama.cpp 和 ComfyUI 稳定共存 背景手里有一台服务器,装了两张魔改版 RTX 2080 Ti,每张 22GB 显存,总共 44GB。一开始用 LM Studio 跑大语言模型,LM Studio 默认把模型均匀摊到两张卡上。 问题很快暴露了——均匀分配意味着两张卡的剩余显存都不多。ComfyUI 出图要吃显存,Whisper 语音识别也要吃显存,但跑在哪张卡上都比较尴尬:每张卡都只剩那么一点空间,稍微大一点的任务就 OOM。 于 2026-05-30 AI基础设施 #GPU #ComfyUI #llama.cpp #显存管理 #多GPU
ComfyUI指定GPU出图配置指南 为什么需要指定 GPU?在多 GPU 服务器上运行 ComfyUI 时,经常遇到以下场景: GPU 资源隔离——GPU 0 被 LM Studio、TensorRT-LLM 等大模型服务占用,ComfyUI 需要跑在另一张卡上 显存大小差异——不同型号 GPU 显存不同,大尺寸出图(如 SDXL、1024×1024)需要更大显存的显卡 多用户并发——团队共用服务器时,不同服务分配到固定 GPU, 2026-05-27 技术教程 #配置 #GPU #ComfyUI #AI绘画
AutoQuant 开发周报 - 2026/05/24 AutoQuant 开发周报 - 2026/05/24📊 本周数据概览 指标 数值 Git 提交 2 次 文件修改 63 个 代码新增 9,653 行 代码删除 496 行 版本升级 v1.7.0 → v2.0.0 🎯 重点改进1. 架构重构:从 Streamlit 单体到 FastAPI + React SPA本周最大的里程碑是 AutoQu 2026-05-24 量化交易 #AutoQuant #开发周报,量化交易,v2.0
LM Studio 报 Unknown StringValue filter: safe?一个脚本原地修复 GGUF 下载了个新模型,LM Studio 一跑就报错。折腾半天,最后发现只需要改一个单词。 翻车现场最近在模型服务器上部署 Qwen3.6-35B-A3B-Uncensored,模型下好了,LM Studio 加载也正常,结果一发消息就炸了: 12AI_ProviderSpecificError: Unknown StringValue filter: safeError rendering pro 2026-05-20 技术笔记 #LM Studio #本地部署 #GGUF #Jinja #LLM #踩坑
AI写真表情控制:让虚拟人物「笑」起来 背景用 AI 生成人物写真时,最头疼的问题之一是:脸像了,但表情僵了。 我用 ComfyUI + FaceID(IP-Adapter FaceID Plus V2)生成韩梅梅的虚拟写真。FaceID 的核心能力是保持面部一致性——不管换什么场景、穿什么衣服,脸都是同一个人。但代价也很明显:表情被「锁死」了。默认输出永远是平静、中性的表情,笑容若有若无。 这篇文章分享我如何突破这个限制,让虚拟人 2026-05-20 AI创作 #ComfyUI #Stable Diffusion #AI写真 #FaceID #表情控制
Hermes Agent Gateway 多实例配置实践 背景最近将 Hermes Agent 从 v0.13.0 升级到了 v0.14.0,发现之前配置的两个 Gateway 实例无法同时运行了。特此记录完整的排查过程和解决方案,供有同样需求的开发者参考。 问题描述初始状态(v0.13.0)在 v0.13.0 版本中,成功配置了两个独立的 Gateway 实例: Profile 端口 用途 default 8642 默认代理通信 han 2026-05-20 技术分享 #AI-Agent #Hermes #Gateway #服务器运维
ComfyUI 实战:知乎社区提示词的 Hi-Res Fix 实践 使用知乎社区推荐的 Stable Diffusion 模型提示词,搭配 DreamShaper 8 + Hi-Res Fix 工作流生成高清图片。 2026-05-15 AI绘画 #ComfyUI #AI绘画 #DreamShaper #Hi-Res Fix #提示词工程
ComfyUI + SDXL 实战:从全灰图到高清人像的踩坑之路 在 RTX 2080Ti (11GB) 上成功运行 SDXL 生成 1024×1024 高清人像,记录从全灰图到成功出图的完整排障过程。 2026-05-15 AI绘画 #ComfyUI #AI绘画 #SDXL #Stable Diffusion XL #显存优化