扩散模型(一)数学原理介绍和相关简要面试问答题汇总
Diffusion Model 一、写在前面 虽然参数量规模上,Diffusion貌似还不是很够格,至少不能和任何一款商用大语言模型竞争,但许多人,许多公司会将其纳入“大模型”这一范畴。这是由于: 领域归属:Diffusion 属于“AIGC”(人工智能生成内容)领域。 模型规模:其模型参数量和训练需求(如硬件资源 GPU、服务器,以及高质量标注数据集的需求)已达到了“大模型”的门槛。 高校实验室的算力和数据储备通常只能进行特定模块的研发(如 AnimateDiff)或能力分析,很难独立复现像 Stable Diffusion 或 Open-Sora 这类的项目。究其原因,是因为 Diffusion 模型的工程成果具有极高的商业变现潜力,速度甚至超过 LLM(大语言模型)。 实操建议: 如果想真正上手 Diffusion 模型,可尝试复现 AudioLDM(Audio Latent Diffusion Model) 并自行训练。原因是音频模型对显存要求较低,相关研究开展时间较长,数据集易采集且详尽。 关于误区: 请不要将“使用过 Stable Diffusion 的...
简短介绍
目前是2024年12月2日,打算写个log记录下一直在看的,以前看过的和一些对应的简单的想法。具体来讲打算整合一下过往笔记,做一些项目介绍。时间比较仓促,代码水平比较低下,页面比较粗糙,麻烦见谅。后续会逐渐完善的。