[NOIP2021] 棋局

本文分类：news发布日期：2026/4/12 10:02:21

PyTorch Gradient Clipping：稳定大模型训练过程在现代深度学习的实践中，尤其是面对像Transformer、BERT或GPT这类参数量动辄数亿甚至上千亿的大模型时，训练过程中的稳定性问题已成为开发者必须直面的技术门槛。一个看似微小的梯度异常&#…

建站知识 2026/4/12 10:01:05

2025必备10个降AIGC工具，继续教育者必看！ AI降重工具：让学术写作更从容随着人工智能技术的广泛应用，论文创作中出现的AIGC痕迹越来越成为学术界关注的焦点。对于继续教育领域的学习者和研究者而言，如何在保证内容质量…

建站知识 2026/4/11 0:05:59

Jupyter Notebook代码折叠：提升长脚本阅读体验在深度学习项目中，你是否曾面对一个长达上千行的 Jupyter Notebook 文件，翻来覆去却找不到训练循环的位置？当你试图向同事解释模型结构时，对方却被满屏的数据预处理代码淹…

建站知识 2026/4/9 9:26:24

GitHub Gist 分享代码片段：快速传播 PyTorch 技巧在深度学习项目中，最让人头疼的往往不是模型设计本身，而是环境配置——尤其是当团队成员各自在不同机器上折腾 CUDA 驱动、cuDNN 版本和 PyTorch 兼容性时。一个“别人能跑，我不能…

建站知识 2026/3/31 18:15:04

HuggingFace Inference API调用：无需GPU运行大模型在今天，一个没有独立显卡的学生笔记本，也能“跑”大模型了。这听起来像天方夜谭——毕竟我们常听说，训练一个BERT需要数块A100，推理LLaMA-3至少得32GB显存。但现实是…

建站知识 2026/3/30 9:11:51

通读《代码大全2》前三分之一内容，我最大的收获是打破了“代码仅为实现功能工具”的固有认知，深刻体会到编程是一门需严谨逻辑、系统思维与工匠精神的工程学科。这部分内容以“打好编程基础”为核心，从代码可读性、…

建站知识 2026/3/27 18:21:46

AI应用架构师的独特视角：人机协作新范式流程设计最佳实践关键词：人机协作、AI应用架构、流程设计、角色定位、反馈循环、责任边界、持续优化摘要：当AI从“工具”变成“协作伙伴”，我们需要重新思考人与AI的关系——不是“谁替代谁…

建站知识 2026/3/30 17:08:30

12.22 - 12.28 周总结这一周练习了关于字符串专题。复习了可持久化 trie，并学习了 AC 自动机。 AC 自动机可以记录多个串互相的前缀关系，并用一个文本串可以匹配多个模式串。简单来说就是在 trie 树上找 fail，具…

建站知识 2026/3/29 16:29:11