☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
聊天机器人或客服助手是AI工具,希望通过互联网上的文本或语音与用户的交付,实现业务价值。聊天机器人的发展在这几年间迅速进步,从最初的基于简单逻辑的机器人到现在基于自然语言理解(NLU)的人工智能。对于后者,构建此类聊天机器人时最常用的框架或库包括国外的RASA、Dialogflow和Amazon Lex等,以及国内大厂百度、科大讯飞等。这些框架可以集成自然语言处理(NLP)和NLU来处理输入文本、分类意图并触发正确的操作以生成响应。
随着大型语言模型(LLM)的出现,我们可以直接使用这些模型构建功能齐全的聊天机器人。其中一个著名的LLM例子是来自OpenAI的生成Generative Pre-trained Transformer 3 (GPT-3:chatgpt就是基于gpt fine-tuning及加入人类反馈模型的),它可以通过使用对话或会话数据来fine-tuning模型,生成类似于自然对话的文本。这种能力使其成为构建自定义聊天机器人的最佳选择。
今天我们来聊如何通过fine-tuning GPT-3模型来构建满足属于我们自己的简单会话聊天机器人。
通常,我们希望在自己的业务对话示例的数据集上fine-tuning模型,例如客户服务的对话记录、聊天日志或电影中的字幕。fine-tuning过程调整模型的参数,让它更好地适应这些会话数据,从而使聊天机器人更擅长理解和回复用户输入。
要fine-tuningGPT-3,我们可以使用Hugging Face的Transformers库,该库提供了预训练模型和fine-tuning工具。该库提供了几种不同大小和较多能力的GPT-3模型。模型越大,可以处理的数据就越多,精度也可能越高。但是,为了简单起见,我们这次使用的是OpenAI接口,可通过编写少量的代码来实现fine-tuning。
接下来就是我们使用OpenAI GPT-3 来实现fine-tuning,可从这获取数据集,抱歉我又用国外数据集了,国内真的很少这类已经处理好的数据集。
创建帐户非常简单,可以使用打开这个链接就可以完成。我们可以通过openai key访问 OpenAI 上的模型。创建API 密钥步骤如下:
我们已经创建了api密匙,那么我们可以开始准备fine-tuning模型的数据,在这可以查看数据集。
安装 OpenAI 库pip install openai
安装后,我们就可以加载数据了:
import os
import json
import openai
import pandas as pd
from dotenv import load_dotenv
load_dotenv()
os.environ['OPENAI_API_KEY'] = os.getenv('OPENAI_KEY')
openai.api_key = os.getenv('OPENAI_KEY')
data = pd.read_csv('data/data.csv')
new_df = pd.DataFrame({'Interview AI': data['Text'].iloc[::2].values, 'Human': data['Text'].iloc[1::2].values})
print(new_df.head(5))我们将问题加载到Interview AI列中,并将相应的答案加载到Human列中。我们还需要创建一个环境变量.env文件来保存OPENAI_API_KEY
接下来,我们将数据转换为 GPT-3 的标准。根据文档,确保数据采用JSONL具有两个键的格式,这个很重要:prompt例如completion
{ "prompt" :"" ,"completion" :"" }
{ "prompt" :"" ,"completion" :"" } 重新构造数据集以适应以上方式,基本是循环遍历数据框中的每一行,并将文本分配给Human,将Interview AI文本分配给完成。
output = []
for index, row in new_df.iterrows():
print(row)
completion = ''
line = {'prompt': row['Human'], 'completion': row['Interview AI']}
output.append(line)
print(output)
with open('data/data.jsonl', 'w') as outfile:
for i in output:
json.dump(i, outfile)
outfile.write('n')使用prepare_data命令,这时会在提示时询问一些问题,我们可以提供Y或N回复。
os.system("openai tools fine_tunes.prepare_data -f 'data/data.jsonl' ")最后,一个名为的文件data_prepared.jsonl被转储到目录中。
要fun-tuning模型,我们只需要运行一行命令:
os .system( "openai api fine_tunes.create -t 'data/data_prepared.jsonl' -m davinci " )
这基本上使用准备好的数据从 OpenAI 训练davinci模型,fine-tuning后的模型将存储在用户配置文件下,可以在模型下的右侧面板中找到。
我们可以使用多种方法来验证我们的模型。可以直接从 Python 脚本、OpenAI Playground 来测试,或者使用 Flask 或 FastAPI 等框构建 Web 服务来测试。
我们先构建一个简单的函数来与此实验的模型进行交互。
def generate_response(input_text):
response = openai.Completion.create(
engine="davinci:ft-personal-2025-01-25-19-20-17",
prompt="The following is a conversation with DSA an AI assistant. "
"DSA is an interview bot who is very helpful and knowledgeable in data structure and algorithms.nn"
"Human: Hello, who are you?n"
"DSA: I am DSA, an interview digital assistant. How can I help you today?n"
"Human: {}nDSA:".format(input_text),
temperature=0.9,
max_tokens=150,
top_p=1,
frequency_penalty=0.0,
presence_penalty=0.6,
stop=["n", " Human:", " DSA:"]
)
return response.choices[0].text.strip()
output = generate_response(input_text)
print(output)把它们放在一起。
import os
import json
import openai
import pandas as pd
from dotenv import load_dotenv
load_dotenv()
os.environ['OPENAI_API_KEY'] = os.getenv('OPENAI_KEY')
openai.api_key = os.getenv('OPENAI_KEY')
data = pd.read_csv('data/data.csv')
new_df = pd.DataFrame({'Interview AI': data['Text'].iloc[::2].values, 'Human': data['Text'].iloc[1::2].values})
print(new_df.head(5))
output = []
for index, row in new_df.iterrows():
print(row)
completion = ''
line = {'prompt': row['Human'], 'completion': row['Interview AI']}
output.append(line)
print(output)
with open('data/data.jsonl', 'w') as outfile:
for i in output:
json.dump(i, outfile)
outfile.write('n')
os.system("openai tools fine_tunes.prepare_data -f 'data/data.jsonl' ")
os.system("openai api fine_tunes.create -t 'data/data_prepared.jsonl' -m davinci ")
def generate_response(input_text):
response = openai.Completion.create(
engine="davinci:ft-personal-2025-01-25-19-20-17",
prompt="The following is a conversation with DSA an AI assistant. "
"DSA is an interview bot who is very h
elpful and knowledgeable in data structure and algorithms.nn"
"Human: Hello, who are you?n"
"DSA: I am DSA, an interview digital assistant. How can I help you today?n"
"Human: {}nDSA:".format(input_text),
temperature=0.9,
max_tokens=150,
top_p=1,
frequency_penalty=0.0,
presence_penalty=0.6,
stop=["n", " Human:", " DSA:"]
)
return response.choices[0].text.strip()示例响应:
input_text = "what is breadth first search algorithm" output = generate_response(input_text)
The breadth-first search (BFS) is an algorithm for discovering all the reachable nodes from a starting point in a computer network graph or tree data structure
GPT-3 是一种强大的大型语言生成模型,最近火到无边无际的chatgpt就是基于GPT-3上fine-tuning的,我们也可以对GPT-3进行fine-tuning,以构建适合我们自己业务的聊天机器人。fun-tuning过程调整模型的参数可以更好地适应业务对话数据,让机器人更善于理解和响应业务的需求。经过fine-tuning的模型可以集成到聊天机器人平台中以处理用户交互,还可以为聊天机器人生成客服回复习惯与用户交互。整个实现可以在这里找到,数据集可以从这里下载。
# gpt
# 就可以
# 来实现
# 加载
# 并将
# 客服
# 在这
# 自然语言
# 可以使用
# 自己的
# 我们可以
# prompt
# ai工具
# gpt-3
# nlp
# transformer
# 人工智能
# 接口
# 循环
# pip
# fastapi
# flask
# Python
# chatgpt
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
网络优化91478 】
【
技术知识72672 】
【
云计算0 】
【
GEO优化84317 】
【
优选文章0 】
【
营销推广36048 】
【
网络运营41350 】
【
案例网站102563 】
【
AI智能45237 】
相关推荐:
CareerCraft AI:提升大学生实习就业的智能平台
豆包AI怎样生成PPT目录页_豆包AI目录自动生成与页码添加【指南】
Lovart AI设计助手:AI驱动设计,零成本开启创意新纪元
扣子AI怎样设置敏感词过滤_扣子AI过滤规则与自定义词库【技巧】
一键生成PPT工具怎么用_一键生成PPT工具使用方法详细指南【教程】
微信AI数字人怎样切换形象风格_微信AI数字人形象更换与风格选择【技巧】
百度网页版ai助手怎么关 百度网页ai对话框屏蔽
颠覆工作方式:2025年必备的9款强大AI工具
AI绘画工具怎么用_AI绘画工具使用方法详细指南【教程】
WorkPPT:AI驱动的PPT制作神器,效率提升不止10倍!
怎么用AI学习新知识?3步教你构建个人知识库
夸克AI怎样搜索医疗健康_夸克AI医疗频道与症状自查【技巧】
Power BI: 如何在 Power Query 中更改数据类型
Claude如何导出对话记录_Claude对话导出方法【方法】
SEO必备工具:网站分析与优化终极指南
AI加持:2025年最佳人工智能潜在客户生成工具
AI写作避坑指南:小说家应避免的AI使用与创作技巧
AI产品经理:AI赋能与AI原生,未来PM的技能演进
乐高积木重现约拿的故事:圣经故事趣味解读
AI QA 工程:通往人工智能质量保障工程师的职业道路
扣子AI怎样设置多轮对话逻辑_扣子AI逻辑树搭建与分支设计【教程】
SmartEbook AI:下一代电子书创作工具,轻松实现被动收入
AI在建筑行业的革命:提升效率与优化流程
FeelinAI聊天网页版 Feelin官方网站地址
AI照片编辑终极指南:一键打造潮流图像
Google AI Studio文本转语音教程:零成本创作高质量音频
AI简历生成器:提升求职效率的智能工具
AIPPT:AI驱动的PPT制作工具,高效便捷演示文稿方案
Bluecap:加拿大AI会议助手,提升混合办公效率
稿定AI智能设计怎样自动生成电商Banner_稿定AI智能设计Banner生成流程【步骤】
寓言故事:狮子与老鼠,学习英语的趣味童话之旅
Napkin AI:AI驱动的文本可视化工具,轻松创建思维导图
P&ID图全解析:工艺流程图解读与应用指南
AI赋能QA:测试管理的未来趋势与实践
百度输入法智能预测怎么关 百度输入法ai联想词关闭
千问怎样调整回答语气_千问语气设置亲切专业等【指南】
Talvix AI:AI驱动的招聘平台,提升招聘效率和质量
Replika AI:情感慰藉还是虚拟危机?深度剖析与用户反馈
怎么用AI帮你写一份客户感谢信?维系客户关系的利器
打破平庸:激发你的内在动力,重塑卓越人生
Midjourney怎样生成网页图标_Midjourney图标生成教程【方法】
P&ID图完全解析:符号、应用及绘制指南
Sora 2 API 全面解析:功能、应用与 Lovable 集成指南
唐库AI拆书工具如何提取核心观点_唐库AI拆书工具观点提取与标注方法【攻略】
通义千问网页版怎么切换账号_通义千问账号切换步骤【指南】
Excel AI:5大免费AI功能提升数据分析效率
雷小兔ai智能写作怎么设置写作风格_雷小兔ai智能写作风格选择方法【指南】
Jasper AI如何做SEO优化 Jasper AI结合SurferSEO用法【教程】
feelin聊天官方网站入口 feelinAl官方网站
斑马AI能否查看孩子学习报告_斑马AI报告查看与数据解读【方法】
2023-04-24
南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。