创建一个Python AI聊天助手

新知榜官方账号

2023-09-19 03:32:28

创建一个Python AI聊天助手

本文将介绍如何使用Python和预训练的GPT模型创建一个简单的AI聊天助手。首先，我们需要安装HuggingFaceTransformers库和GPT2模型。然后，我们可以使用这些工具来加载预训练的模型和分词器，以及训练我们的聊天助手。

我们还需要一个知识库来存储问题和答案。在本文中，我们将使用一个CSV文件作为我们的知识库。我们还将实现一个搜索知识库的函数，以便我们的聊天助手可以回答用户的问题。

最后，我们将实现一个简单的聊天循环，以便用户可以与我们的聊天助手交互。

代码示例

import torch
from transformers import GPT2Tokenizer, GPT2Model, GPT2LMHeadModel
from transformers import AdamW, get_linear_schedule_with_warmup
import pandas as pd
import os

#设置设备
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

#获取预训练模型和分词器
tokenizer = GPT2Tokenizer.from_pretrained("gpt2")
model = GPT2LMHeadModel.from_pretrained("gpt2")
model.to(device)

#加载知识库
if not os.path.exists("knowledge_base.csv"):
    print("知识库不存在，请创建知识库文件")
else:
    knowledge_base = pd.read_csv("knowledge_base.csv", header=None)
    knowledge_base.columns = ["question", "answer"]

#生成回应函数
def chatbot(user_input):
    #对用户输入进行分词
    input_ids = torch.tensor(tokenizer.encode(user_input, return_tensors="pt")).unsqueeze(0).to(device)
    #生成回应
    outputs = model.generate(input_ids,
                             max_length=100,
                             do_sample=True,
                             top_k=50,
                             top_p=0.95,
                             temperature=0.7,
                             num_return_sequences=1,
                             num_beams=2,
                             diversity_penalty=0.5,
                             repetition_penalty=1.2,
                             length_penalty=1.0,
                             #保留知识库的问答对
                             knowledge_max_length=100,
                             knowledge_base=knowledge_base)
    #从输出中选择最可能的回应
    output = outputs[0]
    selected_tokens = torch.argmax(output, axis=1).squeeze().tolist()
    selected_tokens = tokenizer.convert_ids_to_tokens(selected_tokens, skip_special_tokens=True)
    response = tokenizer.convert_tokens_to_string(selected_tokens)
    return response

#搜索知识库函数
def search_knowledge_base(question):
    if knowledge_base.empty:
        return "知识库为空，无法回答您的问题。"
    question_tokens = tokenizer.encode(question, return_tensors="pt")
    question_tokens = question_tokens.unsqueeze(0)
    question_tokens = question_tokens.to(device)
    for i in range(len(knowledge_base)):
        knowledge_tokens = question_tokens.repeat(len(knowledge_base), 1, 1)
        knowledge_tokens[:, :1] = torch.tensor(knowledge_base.values[:, i]).to(device)
        similarity_scores = model(knowledge_tokens, labels=None, output_hidden_states=False).logits
        max_similarity_score = torch.max(similarity_scores).item()
        if max_similarity_score > 0.5:
            return knowledge_base.iloc[i].answer
    return "抱歉，我无法回答您的问题。"

#聊天循环
while True:
    user_input = input("您：")
    if user_input.lower() == "quit":
        break
    response = chatbot(user_input)
    print("AI：", response)
    if "知识库" in user_input.lower():
        question = "".join(user_input.split("知识库")[1:]).strip()
        if question:
            answer = search_knowledge_base(question)
            print("AI（知识库）：", answer)

本页网址：https://www.xinzhibang.net/article_detail-12369.html

寻求报道，请

关键词

分享至微信：

相关工具

秘塔写作猫推出的AI对话聊天工具

ColossalChat

Colossal-AI推出的免费开源版ChatGPT聊天机器人替代品

ChatGLM

开源的、支持中英双语的1300亿参数的对话语言模型

天工AI助手

昆仑万维与奇点智源联合研发的对标ChatGPT的大语言模型

ChatGPT

OpenAI旗下AI对话工具

商量SenseChat

商汤科技推出的类ChatGPT的人工智能大语言模型

OpenAI面临分崩离析危机，Claude2.1和StableVideoDiffusion发布，生成式AI大戏仍在继续

过去几天，作为新一轮AI浪潮的领头羊，OpenAI面临一次的分崩离析的重大危机，从董事会宣布辞退创始人兼CEOSamAltman，到回归又被否，期间还经历了多次反转，包括Altman加入微软、员工逼宫、与Anthropic（Claude）合并等。到了北京时间11月22日下午，OpenAI又表示原则上

分类标签 OpenAIClaude2.1StableVideoDiffusionAI浪潮大模型生成式AI

11-23 10:04

如何更好地使用Claude，以及一些使用技巧

如何更好地使用Claude，以及一些使用技巧作为ChatGPT的竞品，Claude有着不俗的实力，同时它也是目前唯一能在国内网络环境下免费使用的国外AI工具。它可以帮助你在各种场合进行聊天、写文章、整理资料和学习知识。下面我们将介绍一些如何更好地使用Claude的技巧：1. 正确的使用方式在使用Cl

分类标签 ClaudeAI工具聊天写文章整理资料学习知识

11-23 10:03

2023年顶级LLM聊天机器人排名

LLM聊天机器人的兴起在2023年，大型语言模型（LLM）的兴起对人工智能领域产生了深远的影响。LLM经过大量文本和代码数据集的训练，可以生成文本、翻译语言、编写不同类型的创意内容，并以信息丰富的方式回答您的问题。其中，聊天机器人是LLM最令人兴奋的应用之一，它是可以模拟与人类对话的计算机程序。20

分类标签 LLM聊天机器人人工智能

10-25 10:21

StabilityAI推出基于Web的聊天界面StableChat

StabilityAI推出基于Web的聊天界面StableChatStabilityAI是图像生成AIStableDiffusion的开发商，其最近推出了开放访问的语言模型StableBeluga的基于Web的聊天界面StableChat。StableBeluga是HuggingFace排行榜上表现

分类标签 StabilityAI语言模型StableBeluga

10-25 10:20

AI独角兽Character.AI谈判筹集数亿美元新资金，估值或达60亿美元

近年来，随着AI技术的不断发展，越来越多的AI独角兽企业正在崛起。其中，生成式AI独角兽企业Character.AI备受关注。据媒体报道，该公司正在进行早期谈判，以筹集数亿美元的新资金，这笔交易可能将这家初创公司的估值推至50亿至60亿美元之间。Character.AI成立于2021年，由前谷歌员工

分类标签 AI独角兽Character.AI生成式AI

10-13 02:52

StabilityAI推出开源大语言模型StableLM，叫板ChatGPT

StabilityAI推出开源大语言模型StableLM，叫板ChatGPT StabilityAI于4月19日推出了开源大语言模型StableLM，挑战ChatGPT。据StabilityAI官网介绍，StableLM的Alpha版本中拥有30亿和70亿参数，后续还将推出150亿至650亿参数的版

分类标签 StabilityAI开源大语言模型StableLMChatGPTStableDiffusion

10-08 03:26

AI声音克隆：逝去的记忆复活，法律和伦理问题随之而来

背景1970年4月，披头士乐队解散，数百万歌迷们伤心不已。50多年后的今天，人工智能（AI）正在将“逝去的记忆”复活，重新创作和重新想象披头士乐队的演唱。然而，AI声音克隆得如此逼真也引发了一系列伦理和法律问题，甚至导致了电信诈骗的出现。最新报告显示，2022年澳大利亚人因诈骗损失了创纪录的31亿美

分类标签 AI声音克隆电信诈骗音乐版权

10-02 01:28

AI创作的版权问题：人类创作力的界定争议

AI创作的版权问题：人类创作力的界定争议AI创作的版权问题引发争议，如何界定人在AI创作过程中所表达的思想和创造力成为争议点。本文通过多个案例说明，AI生成内容是否应受版权保护存在争议，同时介绍了AI音乐在格莱美奖上的提名情况以及AI生成音乐带来的侵权问题。AI创作的版权争议案例艺术家Jason A

分类标签 AI版权问题创作力人工智能艺术音乐

10-02 01:26

AI独角兽Character.AI正在进行数亿美元的新融资，估值或将达到60亿美元

近日，生成式AI独角兽企业Character.AI正在进行早期谈判，以筹集数亿美元的新资金。据报道，本次交易可能将这家初创公司的估值推至50亿至60亿美元之间。Character.AI是生成式AI领域的早期宠儿，吸引了大量投资者的兴趣。今年3月份，Character.AI完成了一笔1.5亿美元的融资

分类标签 AI独角兽Character.AI新融资

09-29 23:02

HuggingFace发布人工智能聊天机器人HuggingChat，成为OpenAI的竞争对手

4月30日消息，据外媒报道，人工智能公司HuggingFace发布了HuggingChat，这是OpenAI流行的人工智能聊天机器人ChatGPT的开源竞争对手。HuggingChat现在可以通过该公司的网站向公众开放，它可以通过HuggingFace应用程序编程接口与第三方应用程序和服务连接。Hu

分类标签 HuggingFaceHuggingChatOpenAI

09-21 17:18

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway