基于大模型技术的书籍检索方法、装置、设备和介质制造方法及图纸

技术编号：44472546 阅读：0 留言：0更新日期：2025-03-04 17:42

本公开提供了一种基于大模型技术的书籍检索方法，涉及人工智能技术领域，尤其涉及自然语言处理、计算机视觉、大模型、生成模型技术领域。具体实现方案为：根据接收到的输入信息，生成待确定图书的图书描述文本；从目标区域图像中确定多个待匹配图书各自的子图像；根据待确定图书的图书描述文本以及多个待匹配图书各自的子图像，从多个待匹配图书中确定目标图书。本公开还提供了一种基于大模型技术的书籍检索装置、电子设备和存储介质。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及人工智能，尤其涉及自然语言处理、计算机视觉、大模型、生成模型。更具体地，本公开提供了一种基于大模型技术的书籍检索方法、装置、电子设备、存储介质以及计算机程序产品。

技术介绍

1、随着人工智能技术的不断发展，大模型的应用越来越广泛。例如，在面对从大量相似物品中确定人们实际想要查找的对象这一技术问题时，目前基于传统模型的解决方案往往难以准确理解用户的实际需求，从而难以帮助用户查找到目标对象。而大模型的出现，更加方便地解决这个问题。

技术实现思路

1、本公开提供了一种基于大模型技术的书籍检索方法、装置、电子设备、存储介质以及计算机程序产品。

2、根据第一方面，提供了一种基于大模型技术的书籍检索方法，该方法包括：根据接收到的输入信息，生成待确定图书的图书描述文本；从目标区域图像中确定多个待匹配图书各自的子图像；根据待确定图书的图书描述文本以及多个待匹配图书各自的子图像，从多个待匹配图书中确定目标图书。

3、根据第二方面，提供了一种基于大模型技术的书籍检索装置，该装置包括：描述文本确定模块，用于根据接收到的输入信息，生成待确定图书的图书描述文本；图像确定模块，用于从目标区域图像中确定多个待匹配图书各自的子图像；目标图书确定模块，用于根据待确定图书的图书描述文本以及多个待匹配图书各自的子图像，从多个待匹配图书中确定目标图书。

4、根据第三方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少

5、根据第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机执行根据本公开提供的方法。

6、根据第五方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序存储于可读存储介质和电子设备其中至少之一上，所述计算机程序在被处理器执行时实现根据本公开提供的方法。

7、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种基于大模型技术的书籍检索方法，包括：

2.根据权利要求1所述的方法，其中，所述输入信息包括输入语音、输入文本和输入图像中的至少之一；所述根据接收到的输入信息，生成待确定图书的图书描述文本包括：

3.根据权利要求2所述的方法，其中，所述从所述输入语音和所述输入文本中的至少之一中提取所述待确定图书的第一特征描述文本包括：

4.根据权利要求2所述的方法，其中，所述从所述输入图像中提取所述待确定图书的第二特征描述文本包括：

5.根据权利要求1所述的方法，其中，所述从目标区域图像中确定多个待匹配图书各自的子图像包括：

6.根据权利要求1所述的方法，还包括：

7.一种基于大模型技术的书籍检索装置，包括：

8.根据权利要求7所述的装置，其中，所述输入信息包括输入语音、输入文本和输入图像中的至少之一；所述图书描述文本确定模块包括：

9.根据权利要求8所述的装置，其中，所述第一特征描述文本确定单元包括：

10.根据权利要求8所述的装置，其中，所述第二特征描述文本确定单元包括：

...

【技术特征摘要】

1.一种基于大模型技术的书籍检索方法，包括：

3.根据权利要求2所述的方法，其中，所述从所述输入语音和所述输入文本中的至少之一中提取所述待确定图书的第一特征描述文本包括：

4.根据权利要求2所述的方法，其中，所述从所述输入图像中提取所述待确定图书的第二特征描述文本包括：

5.根据权利要求1所述的方法，其中，所述从目标区域图像中确定多个待匹配图书各自的子图像包括：

6.根据权利要求1所述的方法，还包括：

7.一种基于大模型技术的书籍检索装置，包括：

8.根据权利要求7所述的装置，其中，所述输入信息包括...

【专利技术属性】
技术研发人员：邱奇，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人