icon of PostgresML

PostgresML

访问官网

PostgresML 是一款功能强大的开源扩展,可将机器学习和人工智能直接集成到您的 PostgreSQL 数据库中。它支持使用简单的 SQL 命令进行 GPU 加速推理、向量搜索和完整的 RAG 管道,从而消除了数据迁移的需要,并为高性能、可扩展的 AI 应用简化了 MLOps 堆栈。

5
收录时间: 2025-09-01
价格类型: 免费增值
月流量: 3.5K

PostgresML 概览

PostgresML 是一款革命性的开源扩展,它将机器学习和人工智能功能直接引入 PostgreSQL 数据库。通过将模型和算法嵌入数据层,它从根本上改变了 AI 应用的构建方式。其核心理念是,将模型迁移到数据端比不断将庞大、动态的数据集迁移到模型端更高效、更易于管理且更可靠。这种方法消除了复杂的数据管道,降低了延迟,并增强了安全性。

PostgresML 将您现有的数据库转变为一个功能齐全的 AI 平台。它支持广泛的功能,从分类和回归等传统机器学习模型,到涉及大型语言模型 (LLM) 和向量搜索的前沿深度学习应用。通过利用 GPU 的强大功能,它加速了计算和模型推理,使实时 AI 在高吞吐量系统中成为可能。

如何使用 PostgresML

PostgresML 的入门过程设计得非常简单,提供了云端和自托管两种选择。

  1. PostgresML Cloud (推荐): 最简单的方式是在 PostgresML Cloud 上注册一个免费账户。这将在几秒钟内为您提供一个无服务器、完全托管的 PostgreSQL 数据库,并配备 GPU 和最先进的 LLM,无需任何设置开销。
  2. 自托管: 对于希望管理自己基础设施的用户,可以使用 Docker 自行托管 PostgresML。您可以拉取官方镜像并用一个简单的命令运行它,从而完全控制您的环境。命令通常是:docker run -it -v postgresml_data:/var/lib/postgresql -p 5433:5432 -p 8000:8000 ghcr.io/postgresml/postgresml:latest
  3. 执行查询: 设置完成后,您可以使用标准 SQL 与 PostgresML 进行交互。您可以训练模型 (例如 pgml.train())、进行预测 (例如 pgml.predict()) 以及执行复杂的 AI 管道。例如,生成文本嵌入就像在文本列上调用 pgml.embed() 函数一样简单。
  4. 使用 SDK: 为了实现无缝的应用集成,PostgresML 提供了特定的客户端库,如 Korvus (适用于 Python、JavaScript、Rust 和 C) 和 postgresml-django,它们将整个 RAG 管道集成到单个数据库查询或 ORM 操作中。

PostgresML 的核心功能

  • 数据库内 ML/AI: 直接在 PostgreSQL 中运行机器学习和 AI 操作,无需单独的系统和数据传输。
  • GPU 加速: 利用 GPU 的能力显著加快计算和模型推理速度,这对于实时应用至关重要。
  • 大型语言模型 (LLM): 直接在您的数据库中集成和使用来自 Hugging Face 等中心的最新 LLM。
  • 端到端 RAG 管道: 为整个检索增强生成 (RAG) 工作流提供内置 SQL 函数:用于文本分割的 pgml.chunk、用于生成向量嵌入的 pgml.embed、用于结果重排序的 pgml.rank 以及用于文本生成的 pgml.transform
  • 向量搜索: 与 pgvector 无缝集成,实现高效、可扩展的高维向量相似性搜索。
  • 多样化的机器学习算法: 包含超过 47 种内置的分类和回归算法 (如 XGBoost),用于传统的机器学习任务。
  • 高性能与可扩展性: 与基于 HTTP 的模型服务相比,推理速度快 8-40 倍,并设计为支持每秒数百万次事务和水平扩展。
  • 全面的 NLP 任务: 支持广泛的自然语言处理任务,包括文本分类、摘要、翻译、问答和文本生成。

PostgresML 的使用案例

PostgresML 是开发人员和数据科学家构建新一代 AI 驱动应用的理想选择。

  • 语义搜索与推荐引擎: 通过使用向量嵌入查找语义相似的项目,构建能够理解用户意图的强大搜索系统。
  • AI 聊天机器人与问答系统: 实施复杂的 RAG 管道,构建能够根据存储在数据库中的私有知识库回答问题的聊天机器人。
  • 实时欺诈检测: 直接在数据库中训练和部署分类模型,以低延迟实时分析交易数据并标记可疑活动。
  • 数据分析与商业智能: 使用数据库内 NLP 总结客户评论、分类支持工单或从非结构化文本数据中提取洞见,而无需将其移出 Postgres。
  • 个性化内容生成: 利用 LLM 根据存储在数据库中的用户数据生成个性化的营销文案、产品描述或电子邮件回复。

PostgresML 的优势特点

PostgresML 的主要优势在于其架构的简洁性和效率。

  • 降低延迟: 通过将模型和数据置于同一位置,消除了网络开销,从而实现更快的查询性能。
  • 增强的安全性与隐私: 数据保留在数据库的安全范围内,简化了合规性并降低了数据泄露的风险。
  • 简化的 MLOps 堆栈: 它将数据存储、模型服务和向量数据库整合到单个系统中,降低了基础设施的复杂性和运营成本。
  • 开发者体验: 允许开发人员使用熟悉的 SQL 来构建和部署复杂的 AI 功能,降低了入门门槛并加速了开发周期。
  • 可扩展性: 建立在 PostgreSQL 坚实且可扩展的基础上,能够处理企业级工作负载。

定价和计划

PostgresML 采用免费增值模式,为不同需求提供灵活性。

  • 开源自托管: PostgresML 扩展是开源的 (MIT 许可证),可以免费自托管,让您完全控制自己的环境。
  • PostgresML Cloud: 提供一个托管的、无服务器的云平台。它包含一个慷慨的免费层,允许开发人员通过免费数据库、GPU 访问和预配置的 LLM 快速入门。对于需要更多资源、专用 GPU 和企业级支持的应用,还提供付费计划。

PostgresML 评论 (0)

还没有评论,成为第一个评论者吧!

登录后即可发表评论

立即登录

PostgresML 替代方案

查看全部
MindsDB

MindsDB

MindsDB 是一个开源的数据库 AI 层,使开发人员能够使用标准 SQL 构建、训练和部署 AI 模型及代理。它能连接数百个数据源,将结构化和非结构化数据统一到知识库中,让您无需复杂的 ETL 管道即可直接从数据中获得 AI 驱动的答案。

8.3K
Weaviate

Weaviate

Weaviate 是一款专为开发人员设计的开源 AI 原生向量数据库。它支持可扩展、低延迟的向量、关键词和混合搜索。它能与流行的机器学习模型无缝集成,根据语义含义存储和查询数据,是构建语义搜索、推荐引擎和检索增强生成(RAG)系统等 AI 应用的理想选择。

172.7K
Vanna.AI

Vanna.AI

Vanna.AI 是一款开源的个性化 AI SQL 代理,可将自然语言问题转化为准确的 SQL 查询。它使用基于您特定数据库模式、文档和历史查询训练的检索增强生成(RAG)模型,在复杂数据集上实现高准确性。它专为安全性、灵活性和轻松集成到任何应用程序而设计,使技术和非技术用户都能毫不费力地从数据中获取洞察。

66.2K
Zilliz

Zilliz

Zilliz 是一款专为可扩展 AI 应用打造的企业级向量数据库。它基于广受欢迎的开源项目 Milvus,提供高性能、高性价比的全托管服务(Zilliz Cloud),用于存储、索引和搜索数十亿级的向量嵌入。Zilliz 旨在为 RAG、推荐系统和多模态搜索等应用提供动力,并与主流 AI 框架和云平台无缝集成。

190.6K
免费
Chat With Your Database

Chat With Your Database

一款开源AI工具,让您可以使用自然语言与您的PostgreSQL数据库进行交互。通过简单的聊天界面提问、获取洞察并执行操作,无需编写复杂的SQL查询。

3.5K
Chroma

Chroma

Chroma 是一款专为构建强大的检索增强生成(RAG)AI 应用而设计的开源、AI 原生检索数据库。它简化了嵌入、文档和元数据的存储与搜索,提供向量搜索、全文搜索以及一个可扩展的无服务器云平台。其设计旨在易于使用、经济高效且功能强大,适用于从本地开发到大规模生产的各种场景。

260.5K
Neosync

Neosync

Neosync 是一个开源的数据匿名化和合成数据生成平台。它帮助开发人员和数据科学家创建安全、合规且真实的数集,用于测试、开发和AI模型训练,同时确保跨数据库的引用完整性。

3.4K
Vectorize

Vectorize

Vectorize 是一个 RAG 即服务平台,可简化在非结构化数据上构建 AI 应用的过程。它提供托管的 RAG 管道、丰富的数据源连接器,并可灵活选择使用其托管的向量数据库或连接您自己的数据库,使开发人员能够快速部署生产就绪的 AI 解决方案。

150.0K
Vespa.ai

Vespa.ai

Vespa.ai 是一个用于构建大规模应用的高性能 AI 搜索平台。它统一了向量搜索、文本搜索和机器学习排名,为检索增强生成(RAG)、推荐引擎和智能搜索等高级用例提供支持。它专为实时推理和可扩展性而设计,深受 Spotify 和 Perplexity 等领先公司的信赖,能够以低延迟处理海量数据集。

45.8K
Gmi Cloud

Gmi Cloud

Gmi Cloud 是一个专为可扩展人工智能训练和推理设计的高性能 GPU 云平台。它提供对顶级 NVIDIA GPU 的按需访问、用于实现低延迟的优化推理引擎以及用于简化 MLOps 的集群引擎,使开发人员和企业能够高效且经济地构建、部署和扩展 AI 应用。

73.2K

PostgresML 嵌入功能

只需复制下方嵌入代码,将精美徽章贴到您的博客、文章或应用官网,即可把流量直接引导到本工具详情页,快速提升曝光与用户量!

ToolMage
ToolMage
FOLLOW US ON
105
如何安装?
链接已复制到剪贴板!