如何快速上手Sirius:10分钟完成GPU加速数据库部署指南
如何快速上手Sirius10分钟完成GPU加速数据库部署指南【免费下载链接】sirius项目地址: https://gitcode.com/gh_mirrors/sirius28/sirius想要体验GPU加速数据库带来的极致性能提升吗Sirius作为一款GPU原生SQL引擎能够为DuckDB等数据库提供5倍以上的查询加速。这篇快速上手指南将帮助您在10分钟内完成Sirius GPU加速数据库的部署和配置让您立即体验到GPU计算带来的数据分析革命性变革。 Sirius是什么为什么选择GPU加速数据库Sirius是一款基于NVIDIA CUDA-X库包括cuDF和RAPIDS Memory Manager构建的GPU原生SQL引擎。它通过标准的Substrait查询格式无缝集成到现有数据库系统中无需重写查询或进行重大系统更改。Sirius目前支持DuckDBDoris支持即将推出。Sirius的核心优势5倍性能提升在1TB TPC-H数据上Sirius在DGX Station上为DuckDB带来5倍加速零代码修改透明GPU执行无需修改现有SQL查询智能回退机制遇到不支持的操作符时自动回退到CPU执行多层内存管理支持GPU/主机/磁盘分层内存管理 系统要求与准备工作硬件要求GPUNVIDIA Volta™或更高版本计算能力7.0内存建议至少16GB系统内存CPU建议至少16个vCPU以加速编译过程软件要求操作系统Ubuntu 22.04或更高版本CUDA 13.0需要NVIDIA驱动570依赖工具Git用于克隆仓库Pixi环境管理工具⚡ 10分钟快速部署步骤步骤1克隆Sirius仓库git clone --recurse-submodules https://gitcode.com/gh_mirrors/sirius28/sirius.git cd sirius步骤2设置Pixi环境并构建# 进入Pixi环境 pixi shell # 使用多核并行编译 CMAKE_BUILD_PARALLEL_LEVEL$(nproc) make提示如果编译过程中内存消耗过高可以适当降低CMAKE_BUILD_PARALLEL_LEVEL值。步骤3配置Sirius环境创建Sirius配置文件sirius.yaml您可以在test/cpp/integration/integration.yaml找到示例配置export SIRIUS_CONFIG_FILE/path/to/sirius.yaml步骤4启动DuckDB并加载Sirius扩展./build/release/duckdb在DuckDB shell中Sirius扩展会自动加载所有查询将默认使用GPU加速执行。 两种GPU执行模式选择Sirius提供两种执行路径满足不同场景需求1.gpu_execution推荐特点支持外核执行具有分层内存管理数据格式Parquet格式适用场景大数据集处理支持自动数据分区和溢出2.gpu_processing特点内存内执行数据集必须适合GPU内存数据格式DuckDB原生存储格式适用场景中小数据集追求极致性能 实际应用示例创建Parquet数据视图-- 创建Parquet数据视图 CREATE VIEW lineitem AS SELECT * FROM read_parquet(/data/lineitem/*.parquet); CREATE VIEW orders AS SELECT * FROM read_parquet(/data/orders/*.parquet);运行GPU加速查询-- 使用gpu_execution函数显式调用 CALL gpu_execution(SELECT l_returnflag, l_linestatus, sum(l_quantity) as sum_qty, sum(l_extendedprice) as sum_base_price, sum(l_extendedprice * (1 - l_discount)) as sum_disc_price FROM lineitem WHERE l_shipdate date 1998-09-02 GROUP BY l_returnflag, l_linestatus ORDER BY l_returnflag, l_linestatus);透明GPU执行默认-- 普通SQL自动在GPU上运行 SELECT l_returnflag, l_linestatus, sum(l_quantity) as sum_qty, sum(l_extendedprice) as sum_base_price, sum(l_extendedprice * (1 - l_discount)) as sum_disc_price FROM lineitem WHERE l_shipdate date 1998-09-02 GROUP BY l_returnflag, l_linestatus ORDER BY l_returnflag, l_linestatus; 配置与调优技巧日志配置Sirius使用spdlog进行日志记录可通过环境变量或DuckDB SET命令配置# 环境变量配置 export SIRIUS_LOG_DIR/path/to/logs export SIRIUS_LOG_LEVELtrace-- DuckDB SET命令配置 SET sirius_log_dir /path/to/logs; SET sirius_log_level trace; SET sirius_log_flush_seconds 1;性能监控Sirius提供了详细的性能监控信息您可以在日志目录中查看查询执行时间统计GPU内存使用情况数据传输性能指标 生成测试数据集对于TPC-H基准测试可以使用提供的脚本生成测试数据cd test/tpch_performance pixi run bash generate_tpch_data.sh 100 # 生成SF100的Parquet数据生成的数据位于test_datasets/tpch_parquet_sf100/目录下您可以在DuckDB中为其创建视图。 注意事项与限制当前支持的数据类型数值类型INTEGER、BIGINT、FLOAT、DOUBLE、DECIMAL字符串类型VARCHAR时间类型DATE、TIMESTAMP当前支持的运算符过滤FILTER投影PROJECTION连接Hash/Nested Loop/Delim JOIN聚合GROUP-BY、AGGREGATION排序ORDER-BY、TOP-N、LIMIT公共表达式CTE重要提醒如果遇到不支持的操作符Sirius会自动回退到DuckDB的CPU执行目前不支持嵌套类型和窗口函数等高级功能项目仍在积极开发中功能会持续完善 深入探索Sirius源码如果您想深入了解Sirius的实现细节可以查看以下关键模块GPU执行引擎src/sirius/目录下的核心实现查询优化器src/planner/目录中的物理计划生成器内存管理src/memory/目录的分层内存管理实现IO子系统src/io/目录的数据源和缓存管理 性能对比与预期效果在实际测试中Sirius在1TB TPC-H数据集上为DuckDB带来了显著的性能提升典型性能提升聚合查询3-5倍加速连接操作4-7倍加速排序操作2-4倍加速 开始您的GPU加速之旅现在您已经掌握了Sirius的快速部署方法可以立即开始体验GPU加速数据库带来的性能飞跃。记住Sirius的设计理念是零侵入式加速——您现有的SQL查询无需任何修改就能获得GPU加速的好处。随着Sirius项目的不断发展更多功能和优化将持续加入。如果您在部署或使用过程中遇到任何问题欢迎查阅项目文档或参与社区讨论。立即开始您的GPU加速数据分析之旅体验前所未有的查询性能【免费下载链接】sirius项目地址: https://gitcode.com/gh_mirrors/sirius28/sirius创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关新闻

CANN/ops-nn原地自然对数算子

CANN/ops-nn原地自然对数算子

aclnnForeachLogInplace 【免费下载链接】ops-nn 本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-nn 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推…

2026/6/18 7:26:07阅读更多 →
2026中国企业AI应用场景报告

2026中国企业AI应用场景报告

本报告全面剖析了当前行业AI应用现状,深入分析了企业成功应用AI的范式与关键要素。报告整合了50多个实际案例,为企业在AI转型过程中提供实践指导与借鉴。内容涵盖AI技术在各行业的具体应用、实施策略、挑战及解决方案,是企业实现智能化升级的…

2026/6/18 7:26:07阅读更多 →
org-rs社区与生态:如何参与这个开源Rust项目的发展

org-rs社区与生态:如何参与这个开源Rust项目的发展

org-rs社区与生态:如何参与这个开源Rust项目的发展 【免费下载链接】org-rs org-mode parser rewrite in Rust 项目地址: https://gitcode.com/gh_mirrors/or/org-rs org-rs是一个使用Rust重写的Org Mode解析器项目,致力于提供高效可靠的Org模式解…

2026/6/18 7:26:07阅读更多 →
BIThesis 3.7.0版本发布:快速响应北京理工大学研究生学位论文新规

BIThesis 3.7.0版本发布:快速响应北京理工大学研究生学位论文新规

BIThesis 3.7.0版本发布:快速响应北京理工大学研究生学位论文新规 【免费下载链接】BIThesis 📖 北京理工大学非官方 LaTeX 模板集合,包含本科、研究生毕业设计模板及更多。🎉 (更多文档请访问 wiki 和 release 中的手…

2026/6/18 8:46:18阅读更多 →
ComfyUI终极指南:掌握最强大的AI创作引擎

ComfyUI终极指南:掌握最强大的AI创作引擎

ComfyUI终极指南:掌握最强大的AI创作引擎 【免费下载链接】ComfyUI The most powerful and modular diffusion model GUI, api and backend with a graph/nodes interface. 项目地址: https://gitcode.com/GitHub_Trending/co/ComfyUI ComfyUI是当今最强大、…

2026/6/18 8:46:18阅读更多 →
3步搞定加密音乐!本地免费工具让你永久拥有音乐自由 [特殊字符]

3步搞定加密音乐!本地免费工具让你永久拥有音乐自由 [特殊字符]

3步搞定加密音乐!本地免费工具让你永久拥有音乐自由 🎵 【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库: 1. https://github.com/unlock-music/unlock-music ;2. https://git.unlock-music.dev/um/web 项目…

2026/6/18 8:46:18阅读更多 →
用奥卡姆剃刀、VC维与NFL定理解剖过拟合与欠拟合

用奥卡姆剃刀、VC维与NFL定理解剖过拟合与欠拟合

1. 这三个理论,真能帮我们看清过拟合和欠拟合的本质吗?你训练一个模型,训练集上准确率99%,测试集上直接掉到65%——这不是玄学,是过拟合在敲门。你换了个更“简单”的模型,训练集和测试集都卡在72%&#xf…

2026/6/18 8:46:18阅读更多 →
2025终极指南:如何用openpilot为你的爱车免费升级智能驾驶系统

2025终极指南:如何用openpilot为你的爱车免费升级智能驾驶系统

2025终极指南:如何用openpilot为你的爱车免费升级智能驾驶系统 【免费下载链接】openpilot openpilot is an operating system for robotics. Currently, it upgrades the driver assistance system on 300 supported cars. 项目地址: https://gitcode.com/GitHub…

2026/6/18 8:46:18阅读更多 →
GLM-5.1长程任务能力解析:从CUDA优化到系统级工程闭环

GLM-5.1长程任务能力解析:从CUDA优化到系统级工程闭环

1. 项目概述:当开源模型开始“连续上班8小时”,我们该重新定义“工程师”了你有没有试过让一个AI模型帮你写一段CUDA Kernel?我试过,三年前用当时最强的开源模型,它能生成语法正确的代码,但跑起来要么报错&…

2026/6/18 8:41:16阅读更多 →
ZigBee HA智能家居开发实战:从集群模型到NXP JN516x代码实现

ZigBee HA智能家居开发实战:从集群模型到NXP JN516x代码实现

1. ZigBee HA:智能家居的“通用语言”与开发基石如果你正在或计划踏入智能家居设备开发领域,尤其是基于ZigBee协议,那么“ZigBee Home Automation”这个名词你一定不陌生。它不仅仅是ZigBee联盟定义的一套应用层规范,更是确保不同…

2026/6/18 0:00:24阅读更多 →
Java毕设选题推荐:基于 Spring Boot 的个人随笔博客运维管理系统的设计与实现 基于 Spring Boot 的用户原创博客分享社区【附源码、mysql、文档、调试+代码讲解+全bao等】

Java毕设选题推荐:基于 Spring Boot 的个人随笔博客运维管理系统的设计与实现 基于 Spring Boot 的用户原创博客分享社区【附源码、mysql、文档、调试+代码讲解+全bao等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

2026/6/18 0:00:24阅读更多 →
JN517x嵌入式开发实战:看门狗、脉冲计数器与I2C接口的深度解析与避坑指南

JN517x嵌入式开发实战:看门狗、脉冲计数器与I2C接口的深度解析与避坑指南

1. 项目概述在嵌入式开发领域,尤其是基于NXP JN517x这类无线微控制器的项目中,系统稳定性和与外设的可靠交互是两大核心挑战。前者关乎产品能否在无人值守的复杂环境中长期运行,后者则决定了设备能否准确感知世界并与其他芯片“对话”。JN517…

2026/6/18 0:00:24阅读更多 →