您现在的位置是:首页 > 技术教程 正文

Unity+讯飞星火大模型+Web api,实现二次元小姐姐AI聊天互动

admin 阅读: 2024-03-31
后台-插件-广告管理-内容页头部广告(手机)

1.简述

        最近讯飞的星火大模型更新了2.0版本,增强了AI的语言生成能力。毕竟是国产大语言模型,我也尝试使用了一下星火大模型的应用广场,体验还是很不错的。应用广场提供了很多AI助手工具,也支持用户创建自己的AI助手,能力不局限于自然语言生成,也有一些图片生成工具、视频生成工具之类的,总的来说,还是很有意思的。

        同时,星火大模型也提供有api服务,可以很方便的集成到自己的应用里。申请api应用的门槛也比较低,简单填写一些信息,就可以申请试用。试用审核大概半个多小时就结束了,官方提供的免费token数量还是比较可观。针对星火大模型V1.5版本以及V2.0版本,各提供了200万的token试用,非常的良心。我的AI二次元小姐姐项目里,使用chatgpt以及一些开源模型的方式,相对来说还是有一定使用门槛,而接入星火大模型门槛就很低了。

        本文就简单介绍一下unity端集成星火大模型API的代码实现,让星火大模型驱动我们的AI二次元小姐姐,与大家聊天吧。

2.开通星火大模型服务

        本节内容将简单介绍一下如何在讯飞星火大模型官网,申请试用星火大模型,并创建星火大模型的应用。

星火大模型官方地址:讯飞星火认知大模型-AI大语言模型-星火大模型-科大讯飞 (xfyun.cn)

        在申请星火大模型服务之前,需要先注册讯飞的账户,使用手机号码验证就可以了,这里不多赘述。在星火大模型官方站点主页,找到【API测试】按钮,可以点击进入API试用申请的页面。

        点击【API测试申请】,即可进入API测试申请界面,如图所示:

        在API申请界面中,填写必填的信息。这里需要注意一下,申请API测试,需要创建一个讯飞的应用,我们可以填写一个自己实现申请号的应用ID,也可以在申请页面点击创建一个新的应用,创建应用成功之后,我们就能够获得应用的密钥,这个在后面的接口对接会使用的到。

        申请提交之后,耐心等待官方审核即可。时间不会太久,我大概是半小时左右,就完成审批,拿到api的试用服务了。

3.对接API服务

        星火大模型应用申请完成之后,我们就可以拿到应用的密钥。进入到讯飞开放平台的控制台界面,选择到新创建的星火大模型服务,我们就可以看到服务剩余的token数,以及应用的密钥信息了。这个页面可以切换查看V1.5和V2.0两个版本的token使用情况。

3.1 API对接流程

        星火大模型的接口对接,考虑到跨平台的兼容性,这里选择采用web方式对接,根据官方文档的说明,我们首先需要调用鉴权接口,获取到接口授权,然后在使用websocket协议与服务端握手,websocket握手成功后,需要在60秒内发送请求。接口采用的是流式输出模式,需要对根据返回的数据判断,并拼接成完整的回复信息,大致流程如下如所示:

        接下来,将描述一下具体的代码实现。

3.2 接口鉴权

        根据官方文档的说明,开发者需要自行先在控制台创建应用,利用应用中提供的appid,APIKey, APISecret进行鉴权,生成最终请求的鉴权url,鉴权参数如下:

参数类型必须说明示例
hoststring请求的主机aichat.xf-yun.com(使用时需替换为实际使用的接口地址)
datestring当前时间戳,采用RFC1123格式,时间偏差需控制在300s内Fri, 05 May 2023 10:43:39 GMT
authorizationstringbase64编码的签名信息参考下方生成方式

        以下是在unity端实现鉴权url的处理代码:

  1. ///
  2. /// 获取鉴权url
  3. ///
  4. ///
  5. private string GetAuthUrl()
  6. {
  7. string date = DateTime.UtcNow.ToString("r");
  8. Uri uri = new Uri(url);
  9. StringBuilder builder = new StringBuilder("host: ").Append(uri.Host).Append("\n").//
  10. Append("date: ").Append(date).Append("\n").//
  11. Append("GET ").Append(uri.LocalPath).Append(" HTTP/1.1");
  12. string sha = HMACsha256(m_XunfeiSettings.m_APISecret, builder.ToString());
  13. string authorization = string.Format("api_key=\"{0}\", algorithm=\"{1}\", headers=\"{2}\", signature=\"{3}\"", m_XunfeiSettings.m_APIKey, "hmac-sha256", "host date request-line", sha);
  14. string NewUrl = "https://" + uri.Host + uri.LocalPath;
  15. string path1 = "authorization" + "=" + Convert.ToBase64String(System.Text.Encoding.UTF8.GetBytes(authorization));
  16. date = date.Replace(" ", "%20").Replace(":", "%3A").Replace(",", "%2C");
  17. string path2 = "date" + "=" + date;
  18. string path3 = "host" + "=" + uri.Host;
  19. NewUrl = NewUrl + "?" + path1 + "&" + path2 + "&" + path3;
  20. return NewUrl;
  21. }
  22. public string HMACsha256(string apiSecretIsKey, string buider)
  23. {
  24. byte[] bytes = System.Text.Encoding.UTF8.GetBytes(apiSecretIsKey);
  25. System.Security.Cryptography.HMACSHA256 hMACSHA256 = new System.Security.Cryptography.HMACSHA256(bytes);
  26. byte[] date = System.Text.Encoding.UTF8.GetBytes(buider);
  27. date = hMACSHA256.ComputeHash(date);
  28. hMACSHA256.Clear();
  29. return Convert.ToBase64String(date);
  30. }

3.3 接口请求

       3.3.1 接口费用与服务地址

        根据官方文档说明,星火大模型的1.5版本以及2.0版本的计费模型以及资源地址是不同的,当然我们免费申请的服务是不需要额外付费的,但超过额度了的话,就需要付费了,token的价格如下所示:

服务引擎单价
讯飞星火认知大模型V1.50.18元/万tokens
讯飞星火认知大模型V2.00.36元/万tokens

        两个版本的api地址分别是:

        ①星火大模型1.5版本请求地址,对应的domain参数为general

ws(s)://spark-api.xf-yun.com/v1.1/chat

        ②星火大模型1.5版本请求地址,对应的domain参数为generalv2:

ws(s)://spark-api.xf-yun.com/v2.1/chat
3.3.2 发送报文结构        

        星火大模型的API服务对接部分,按照文档说明,使用websocket协议握手成功之后,就可以根据报文格式发送信息了。请求参数参数部分的接口说明如下:

header部分

参数名称类型必传参数要求参数说明
app_idstring应用appid,从开放平台控制台创建的应用中获取
uidstring最大长度32每个用户的id,用于区分不同用户

parameter.chat部分

参数名称类型必传参数要求参数说明
domainstring取值为[general,generalv2]指定访问的领域,general指向V1.5版本 generalv2指向V2版本。注意:不同的取值对应的url也不一样!
temperaturefloat取值为[0,1],默认为0.5核采样阈值。用于决定结果随机性,取值越高随机性越强即相同的问题得到的不同答案的可能性越高
max_tokensint取值为[1,4096],默认为2048模型回答的tokens的最大长度
top_kint取值为[1,6],默认为4从k个候选中随机选择⼀个(⾮等概率)
chat_idstring需要保障用户下的唯一性用于关联用户会话

payload.message.text部分

注:text下所有content累计内容 tokens需要控制在8192内

参数名称类型必传参数要求参数说明
rolestring取值为[user,assistant]user表示是用户的问题,assistant表示AI的回复
contentstring所有content的累计tokens需控制8192以内用户和AI的对话内容

报文示例:

  1. {
  2. "header": {
  3. "app_id": "12345",
  4. "uid": "12345"
  5. },
  6. "parameter": {
  7. "chat": {
  8. "domain": "general",
  9. "temperature": 0.5,
  10. "max_tokens": 1024,
  11. }
  12. },
  13. "payload": {
  14. "message": {
  15. # 如果想获取结合上下文的回答,需要开发者每次将历史问答信息一起传给服务端,如下示例
  16. # 注意:text里面的所有content内容加一起的tokens需要控制在8192以内,开发者如有较长对话需求,需要适当裁剪历史信息
  17. "text": [
  18. {"role": "user", "content": "你是谁"} # 用户的历史问题
  19. {"role": "assistant", "content": "....."} # AI的历史回答结果
  20. # ....... 省略的历史对话
  21. {"role": "user", "content": "你会做什么"} # 最新的一条问题,如无需上下文,可只传最新一条问题
  22. ]
  23. }
  24. }
  25. }
        3.3.3 响应报文结构

        接口服务将采用流式输出方式,返回回复信息,我们需要解析返回的报文信息,拼接成完整的回复信息。接口响应的报文结构如下所示:

header部分

字段名类型字段说明
codeint错误码,0表示正常,非0表示出错;详细释义可在接口说明文档最后的错误码说明了解
messagestring会话是否成功的描述信息
sidstring会话的唯一id,用于讯飞技术人员查询服务端会话日志使用,出现调用错误时建议留存该字段
statusint会话状态,取值为[0,1,2];0代表首次结果;1代表中间结果;2代表最后一个结果

payload.choices部分

字段名类型字段说明
statusint文本响应状态,取值为[0,1,2]; 0代表首个文本结果;1代表中间文本结果;2代表最后一个文本结果
seqint返回的数据序号,取值为[0,9999999]
contentstringAI的回答内容
rolestring角色标识,固定为assistant,标识角色为AI
indexint结果序号,取值为[0,10]; 当前为保留字段,开发者可忽略

payload.usage部分(在最后一次结果返回)

字段名类型字段说明
question_tokensint保留字段,可忽略
prompt_tokensint包含历史问题的总tokens大小
completion_tokensint回答的tokens大小
total_tokensintprompt_tokens和completion_tokens的和,也是本次交互计费的tokens大小

        接口响应报文结构示例:

  1. # 接口为流式返回,此示例为最后一次返回结果,开发者需要将接口多次返回的结果进行拼接展示
  2. {
  3. "header":{
  4. "code":0,
  5. "message":"Success",
  6. "sid":"cht000cb087@dx18793cd421fb894542",
  7. "status":2
  8. },
  9. "payload":{
  10. "choices":{
  11. "status":2,
  12. "seq":0,
  13. "text":[
  14. {
  15. "content":"我可以帮助你的吗?",
  16. "role":"assistant",
  17. "index":0
  18. }
  19. ]
  20. },
  21. "usage":{
  22. "text":{
  23. "question_tokens":4,
  24. "prompt_tokens":5,
  25. "completion_tokens":9,
  26. "total_tokens":14
  27. }
  28. }
  29. }
  30. }

3.3.4 接口对接代码示例

        使用websocket协议与服务端握手成功后,按照报文格式要求发送信息,等待接口响应,并解析响应数据拼接成完整的回复信息。代码示例如下所示:

  1. #region websocket连接
  2. ///
  3. /// websocket
  4. ///
  5. private ClientWebSocket m_WebSocket;
  6. private CancellationToken m_CancellationToken;
  7. ///
  8. /// 连接服务器,获取回复
  9. ///
  10. private async void ConnectHost(string text,Action<string> _callback)
  11. {
  12. try
  13. {
  14. stopwatch.Restart();
  15. m_WebSocket = new ClientWebSocket();
  16. m_CancellationToken = new CancellationToken();
  17. string authUrl = GetAuthUrl();
  18. string url = authUrl.Replace("http://", "ws://").Replace("https://", "wss://");
  19. //Uri uri = new Uri(GetUrl());
  20. Uri uri = new Uri(url);
  21. await m_WebSocket.ConnectAsync(uri, m_CancellationToken);
  22. //发送json
  23. string _jsonData = text;
  24. await m_WebSocket.SendAsync(new ArraySegment<byte>(Encoding.UTF8.GetBytes(_jsonData)), WebSocketMessageType.Binary, true, m_CancellationToken); //发送数据
  25. StringBuilder sb = new StringBuilder();
  26. //用于拼接返回的答复
  27. string _callBackMessage = "";
  28. //播放队列.Clear();
  29. while (m_WebSocket.State == WebSocketState.Open)
  30. {
  31. var result = new byte[4096];
  32. await m_WebSocket.ReceiveAsync(new ArraySegment<byte>(result), m_CancellationToken);//接受数据
  33. List<byte> list = new List<byte>(result); while (list[list.Count - 1] == 0x00) list.RemoveAt(list.Count - 1);//去除空字节
  34. var str = Encoding.UTF8.GetString(list.ToArray());
  35. sb.Append(str);
  36. if (str.EndsWith("}"))
  37. {
  38. //获取返回的数据
  39. ResponseData _responseData = JsonUtility.FromJson(sb.ToString());
  40. sb.Clear();
  41. if (_responseData.header.code != 0)
  42. {
  43. //返回错误
  44. //PrintErrorLog(_responseData.code);
  45. Debug.Log("错误码:" + _responseData.header.code);
  46. m_WebSocket.Abort();
  47. break;
  48. }
  49. //没有回复数据
  50. if (_responseData.payload.choices.text.Count == 0)
  51. {
  52. Debug.LogError("没有获取到回复的信息!");
  53. m_WebSocket.Abort();
  54. break;
  55. }
  56. //拼接回复的数据
  57. _callBackMessage += _responseData.payload.choices.text[0].content;
  58. if (_responseData.payload.choices.status == 2)
  59. {
  60. stopwatch.Stop();
  61. Debug.Log("ChatSpark耗时:" + stopwatch.Elapsed.TotalSeconds);
  62. //添加记录
  63. m_DataList.Add(new SendData("assistant", _callBackMessage));
  64. //回调
  65. _callback(_callBackMessage);
  66. m_WebSocket.Abort();
  67. break;
  68. }
  69. }
  70. }
  71. }
  72. catch (Exception ex)
  73. {
  74. Debug.LogError("报错信息: " + ex.Message);
  75. m_WebSocket.Dispose();
  76. }
  77. }
  78. #endregion

4.结束语

        这次的文章简单介绍了讯飞星火大模型的web api的对接流程,并针对接口对接的流程进行了介绍,包括接口的鉴权、websocket握手以及发送报文、响应报文的结构说明,并提供了针对全流程在unity端的实现代码示例。通过上述的代码实现,我们就可以在unity引擎中,使用星火大模型的api来驱动AI二次元小姐姐的对话交互。

        上述代码只包含了核心的代码实现,完整的代码工程可以从我的开源项目下载使用,项目包含了针对多种GPT应用的集成工具,以及语音服务的集成,对我这个项目感兴趣的朋友,可以上我的B站号查看,我也做有详细的教程,相关源码可以在的哔哩哔哩主站找到相关视频,在视频介绍以及评论区获取。

国产星火大模型驱动AI小姐姐聊天,unity开源工具包,手把手打造自己的二次元老婆~


上述项目地址传送门:

AI二次元老婆开源项目(unity-AI-Chat-Toolkit):

Github地址:https://github.com/zhangliwei7758/unity-AI-Chat-Toolkit

Gitee地址:https://gitee.com/DammonSpace/unity-ai-chat-toolkit

标签:
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

在线投稿:投稿 站长QQ:1888636

后台-插件-广告管理-内容页尾部广告(手机)
关注我们

扫一扫关注我们,了解最新精彩内容

搜索
排行榜