最小二乘法
最小二乘法Least Squares Method是统计学和线性回归中最经典、最基础的算法。如果说 “最大似然估计MLE”是一种哲学思想由果推因那么“最小二乘法”就是这种思想在正态分布下最完美、最实用的数学落地工具。本文博主继续用通俗的语言和生活中的例子来拆解。一、 通俗解释寻找“最完美”的平衡点通俗解释最小二乘法的核心目标只有一个画一条最完美的直线让这条直线离所有的数据点“总距离”最近。生活中的例子想象你在玩飞镖靶心是“真实数据”你扔出的飞镖是“预测直线”。如果直线画得太偏飞镖数据点到直线的距离就会很远。最小二乘法就是不断调整直线的角度和位置直到所有飞镖到直线的距离的“平方总和”达到最小。这时候这条直线就是最完美的。二、 为什么非要“平方”核心精髓在计算误差时最小二乘法要求把每个数据点到直线的距离平方后再相加。为什么不能直接算距离消除负号防止误差互相抵消数据点有的在直线上方误差是 5有的在直线下方误差是 -5。如果不平方直接相加5 和 -5 就抵消变成 0 了。模型会误以为自己预测得很准但实际上误差极大。平方之后正负号全变成了正数。惩罚“大错”让模型更稳健误差是 2平方是 4误差是 10平方是 100。平方操作让模型对“偏离特别远的点”极其敏感。为了不让总误差飙升模型会拼命把直线往那些“大错点”的方向拉一拉从而找到一个全局最平衡的位置。三、 最小二乘法与最大似然估计MLE的绝妙闭环还记得博主前面讲过的 MLE 吗在这里它们完美地握手了。MLE 的视角假设数据点的误差服从正态分布寻找让当前数据发生概率最大的那条直线。最小二乘法的视角寻找让所有数据点到直线的“误差平方和”最小的那条直线。 核心洞察在数学上可以严格证明当且仅当误差服从正态分布时MLE 的推导结果在数学形式上完全等价于最小二乘法。也就是说最小二乘法其实就是 MLE 在正态分布假设下的“特例”。这也解释了为什么我们在用最小二乘法时总是要假设数据符合正态分布。四、 最小二乘法的优缺点✅ 优点极其简单、优雅不需要复杂的迭代像 EM 算法那样只要数据量不是大到离谱直接套用一个矩阵公式θ(XTX)−1XTy\theta (X^TX)^{-1}X^Tyθ(XTX)−1XTy一秒钟就能算出最佳直线的参数。理论极其扎实它是无偏估计且在正态分布下具有最优的统计性质。❌ 缺点与 MSE 类似极度害怕异常值Outliers因为要“平方”如果一个数据点偏离了 100 倍它的误差平方就会放大 10000 倍这会把整条直线严重带偏。只能拟合线性关系标准的最小二乘法只能画直线。如果数据本身是弯曲的它就不管用了除非引入多项式特征进行非线性扩展。五、 一句话总结最小二乘法是一种通过“最小化误差平方和”来寻找最佳拟合直线的数学工具。它计算简单、理论完美是最大似然估计在正态分布下的完美化身也是整个线性回归算法的基石。

相关新闻

C盘大文件怎么找出来迁移到D盘彻底腾空间

C盘大文件怎么找出来迁移到D盘彻底腾空间

C盘大文件怎么找出来迁移到D盘彻底腾空间 C盘空间告急,清完临时文件依然红色——真正的根源往往在用户文件、游戏数据和安装包长期堆积在系统盘,缓存只是其中很小的一部分。解决思路是先用命令找出大文件在哪里,再按类型决定迁移还是修改默认…

2026/7/1 17:46:22阅读更多 →
太原优质地坪漆

太原优质地坪漆

在太原,无论是新建厂房、商业空间改造,还是体育场馆升级,一个高品质的地坪系统往往是项目成功的基础。面对市场上琳琅满目的地坪漆品牌,如何选出真正适合本地气候与使用场景的“太原优质地坪漆”?本文将从材料特性、施…

2026/7/1 17:46:22阅读更多 →
如何利用diff-cover提升代码审查效率:差异覆盖率分析实战指南

如何利用diff-cover提升代码审查效率:差异覆盖率分析实战指南

如何利用diff-cover提升代码审查效率:差异覆盖率分析实战指南 【免费下载链接】diff_cover Automatically find diff lines that need test coverage. 项目地址: https://gitcode.com/gh_mirrors/di/diff_cover 在软件开发过程中,代码审查是确保质…

2026/7/1 17:46:22阅读更多 →
在VMware16中安装麒麟Kylin V10时,如何正确配置虚拟机的处理器、内存和网络参数以确保系统稳定运行?

在VMware16中安装麒麟Kylin V10时,如何正确配置虚拟机的处理器、内存和网络参数以确保系统稳定运行?

在VMware Workstation 16中安装麒麟Kylin V10时,合理的硬件资源配置是确保系统稳定运行的基础。以下是针对处理器、内存和网络参数的详细配置指南。 一、虚拟机硬件配置建议 硬件组件推荐配置最低配置说明处理器(CPU)2-4核1核多核可提升多任务处理能力内存(RAM)4-…

2026/7/1 19:11:39阅读更多 →
今日直播复盘

今日直播复盘

TikTok直播一对一沟通完整复盘 直播基础概况 直播发起者:Luca,深圳工厂负责人,公司Care NovaTech,主营老年四轮代步购物推车(单件8-9kg,大件海运成本高),计划7月9日货物发美国海外仓…

2026/7/1 19:11:39阅读更多 →
如何构建企业级工作流系统:RuoYi-Flowable-Plus架构设计与实施指南

如何构建企业级工作流系统:RuoYi-Flowable-Plus架构设计与实施指南

如何构建企业级工作流系统:RuoYi-Flowable-Plus架构设计与实施指南 【免费下载链接】RuoYi-Flowable-Plus 本项目基于 RuoYi-Vue-Plus 进行二次开发扩展Flowable工作流功能,支持在线表单设计和丰富的工作流程设计能力。如果觉得这个项目不错,…

2026/7/1 19:11:39阅读更多 →
桑迪亚实验室 SA3000:抗辐射 8085 处理器,性能远超设计目标!

桑迪亚实验室 SA3000:抗辐射 8085 处理器,性能远超设计目标!

CPU 历史博物馆概况这里是英特尔 CPU、AMD 处理器、Cyrix 微处理器、微控制器等的 CPU 历史博物馆。CPU 总数达 20000 ,制造商总数 150 ,EPROM 总数 2000 。此外,还有主页、关于、图片、参考资料、交易、链接、联系我们等页面。测试板/产品Th…

2026/7/1 19:11:39阅读更多 →
ub-dhcp与BIND集成:动态DNS更新的完整实现指南

ub-dhcp与BIND集成:动态DNS更新的完整实现指南

ub-dhcp与BIND集成:动态DNS更新的完整实现指南 【免费下载链接】ub-dhcp ub-dhcp is an implementation of Linux dhcp for ub device. 项目地址: https://gitcode.com/openeuler/ub-dhcp 前往项目官网免费下载:https://ar.openeuler.org/ar/ ub…

2026/7/1 19:11:39阅读更多 →
VeraCrypt 源代码存档:基于 TrueCrypt 修改,多系统构建及使用许可说明

VeraCrypt 源代码存档:基于 TrueCrypt 修改,多系统构建及使用许可说明

内容1. Windows2. Linux 和 Mac OS X3. FreeBSD 和 OpenBSD4. 第三方开发者(贡献者)5. 法律信息6. 更多信息一、Windows构建适用于 Windows 的 VeraCrypt 的要求关于在 Windows 上构建 VeraCrypt 的详细指南,可在仓库文档中找到,也…

2026/7/1 19:06:38阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/1 4:42:14阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/7/1 5:19:01阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/1 0:01:44阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/1 0:01:44阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/1 0:01:44阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/1 0:01:44阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/1 0:01:44阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/1 0:01:44阅读更多 →