本发明专利技术提供了一种基于用户需求的办公信息处理方法和装置,方法包括:获取并定义需求字段,并存入到预设的第一数据库中,与数据库中的办公脚本进行关联;识别用户输入的办公任务需求信息,并匹配数据库中对应的需求字段,调用相应的办公脚本;用户需求信息包括任务名称、任务类型、任务内容和任务执行频率;任务类型包括采集特定信息、自动化录入数据和PDF文件信息处理;基于任务类型,通过调用的办公脚本,执行相应的办公任务,并将办公任务的执行结果进行可视化展示。本发明专利技术通过定义需求字段,与识别到的办公任务需求信息进行匹配,调用相应脚本,相比于现有技术通过人工采集数据的方式,具有更高的工作效率,且准确性高。且准确性高。且准确性高。
【技术实现步骤摘要】
一种基于用户需求的办公信息处理方法和装置
[0001]本专利技术涉及办公信息处理领域,尤其涉及一种基于用户需求的办公信息处理方法和装置。
技术介绍
[0002]在日常的办公过程中,出于管理、制度或者业务发展的需要,通常存在重复性录入以及信息获取等需求。例如,在财务相关的办公系统中,需要批量地录入财务数据,包括办公涉及的支出记录等。而现有技术主要是基于人工的方式,手动对信息进行逐条录入;在进行信息获取时,则是在办公系统外的浏览器等,自行识别和筛选信息。但是,这种办公系统人工介入的程度较高,而受限于人的精力有限等因素,系统整体的工作效率低、相关人员工作量大且难以保证录入或获取的信息的完整性,具有一定的出错率。
技术实现思路
[0003]本专利技术提供了一种基于用户需求的办公信息处理方法和装置,无需人工进行采集,以解决如何提高整体工作效率的技术问题。
[0004]为了解决上述技术问题,本专利技术实施例提供了一种基于用户需求的办公信息处理方法,包括:
[0005]获取并定义需求字段,将所述需求字段存入到预设的第一数据库中,与所述第一数据库中的办公脚本进行关联;
[0006]识别用户输入的办公任务需求信息,并匹配所述第一数据库中对应的需求字段,调用所匹配需求字段相关联的办公脚本;其中,所述用户需求信息包括任务名称、任务类型、任务内容和任务执行频率;所述任务类型包括采集特定信息、自动化录入数据和PDF文件信息处理;
[0007]基于所述任务类型,通过调用的办公脚本,执行相应的办公任务,并将所述办公任务的执行结果进行可视化展示;
[0008]所述基于所述任务类型,通过调用的办公脚本,执行相应的办公任务,包括:
[0009]当所述任务类型为采集特定信息时,通过调用的办公脚本,基于所述任务内容中的特定字段确定采集范围;
[0010]发起http请求或https请求,按照所述特定字段在所述采集范围内通过所述任务执行频率采集数据,并将获取的数据保存在第二数据库中。
[0011]作为优选方案,所述基于所述任务类型,通过调用的办公脚本,执行相应的办公任务,还包括:
[0012]当所述任务类型为自动化录入数据时,通过调用的办公脚本,基于所述任务内容中需要录入的特定信息,模拟对应的应用进行登录并识别验证码;
[0013]按照所述任务执行频率循环读取第三数据库中的数据,通过css selector识别所述任务内容中各字段对应的元素,根据元素识别结果往录入对象逐个字段进行填写并校
验。
[0014]作为优选方案,所述基于所述任务类型,通过调用的办公脚本,执行相应的办公任务,还包括:
[0015]当所述任务类型为PDF文件信息处理时,通过调用的办公脚本,将待处理PDF文档录入到第四数据库中,并转换为docx文件;
[0016]基于所述任务内容中需要删除的特定信息,通过api操作,删除docx文件中所述需要删除的特定信息,并将经过删除处理的docx文件转换为处理好的PDF文件存储到所述第四数据库中。
[0017]作为优选方案,所述将所述办公任务的执行结果进行可视化展示,具体为:
[0018]获取所述办公任务的执行结果的关键字,通过爬虫程序采集所述关键字的关联信息;
[0019]通过自然语言处理技术,对所述关联信息进行筛选;
[0020]将经过筛选的关联信息进行可视化展示。
[0021]作为优选方案,所述办公脚本通过python实现。
[0022]相应的,本专利技术实施例还提供了一种基于用户需求的办公信息处理装置,包括定义模块、调用模块和执行模块;其中,
[0023]所述定义模块,用于获取并定义需求字段,将所述需求字段存入到预设的第一数据库中,与所述第一数据库中的办公脚本进行关联;
[0024]所述调用模块,用于识别用户输入的办公任务需求信息,并匹配所述第一数据库中对应的需求字段,调用所匹配需求字段相关联的办公脚本;其中,所述用户需求信息包括任务名称、任务类型、任务内容和任务执行频率;所述任务类型包括采集特定信息、自动化录入数据和PDF文件信息处理;
[0025]所述执行模块,用于基于所述任务类型,通过调用的办公脚本,执行相应的办公任务,并将所述办公任务的执行结果进行可视化展示;
[0026]所述执行模块包括第一执行单元,所述第一执行单元用于:
[0027]当所述任务类型为采集特定信息时,通过调用的办公脚本,基于所述任务内容中的特定字段确定采集范围;
[0028]发起http请求或https请求,按照所述特定字段在所述采集范围内通过所述任务执行频率采集数据,并将获取的数据保存在第二数据库中。
[0029]作为优选方案,所述执行模块包括第二执行单元,所述第二执行单元用于:
[0030]当所述任务类型为自动化录入数据时,通过调用的办公脚本,基于所述任务内容中需要录入的特定信息,模拟对应的应用进行登录并识别验证码;
[0031]按照所述任务执行频率循环读取第三数据库中的数据,通过css selector识别所述任务内容中各字段对应的元素,根据元素识别结果往录入对象逐个字段进行填写并校验。
[0032]作为优选方案,所述执行模块包括第三执行单元,所述第三执行单元用于:
[0033]当所述任务类型为PDF文件信息处理时,通过调用的办公脚本,将待处理PDF文档录入到第四数据库中,并转换为docx文件;
[0034]基于所述任务内容中需要删除的特定信息,通过api操作,删除docx文件中所述需
要删除的特定信息,并将经过删除处理的docx文件转换为处理好的PDF文件存储到所述第四数据库中。
[0035]作为优选方案,所述执行模块将所述办公任务的执行结果进行可视化展示,具体为:
[0036]所述执行模块获取所述办公任务的执行结果的关键字,通过爬虫程序采集所述关键字的关联信息;
[0037]通过自然语言处理技术,对所述关联信息进行筛选;
[0038]将经过筛选的关联信息进行可视化展示。
[0039]作为优选方案,所述办公脚本通过python实现。
[0040]相比于现有技术,本专利技术实施例具有如下有益效果:
[0041]本专利技术实施例提供了一种基于用户需求的办公信息处理方法和装置,所述办公信息处理方法包括:获取并定义需求字段,将所述需求字段存入到预设的第一数据库中,与所述第一数据库中的办公脚本进行关联;识别用户输入的办公任务需求信息,并匹配所述第一数据库中对应的需求字段,调用所匹配需求字段相关联的办公脚本;其中,所述用户需求信息包括任务名称、任务类型、任务内容和任务执行频率;所述任务类型包括采集特定信息、自动化录入数据和PDF文件信息处理;基于所述任务类型,通过调用的办公脚本,执行相应的办公任务,并将所述办公任务的执行结果进行可视化展示;所述基于所述任务类型,通过调用的办公脚本,执行相应的办公任本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于用户需求的办公信息处理方法,其特征在于,包括:获取并定义需求字段,将所述需求字段存入到预设的第一数据库中,与所述第一数据库中的办公脚本进行关联;识别用户输入的办公任务需求信息,并匹配所述第一数据库中对应的需求字段,调用所匹配需求字段相关联的办公脚本;其中,所述用户需求信息包括任务名称、任务类型、任务内容和任务执行频率;所述任务类型包括采集特定信息、自动化录入数据和PDF文件信息处理;基于所述任务类型,通过调用的办公脚本,执行相应的办公任务,并将所述办公任务的执行结果进行可视化展示;所述基于所述任务类型,通过调用的办公脚本,执行相应的办公任务,包括:当所述任务类型为采集特定信息时,通过调用的办公脚本,基于所述任务内容中的特定字段确定采集范围;发起http请求或https请求,按照所述特定字段在所述采集范围内通过所述任务执行频率采集数据,并将获取的数据保存在第二数据库中。2.如权利要求1所述的一种基于用户需求的办公信息处理方法,其特征在于,所述基于所述任务类型,通过调用的办公脚本,执行相应的办公任务,还包括:当所述任务类型为自动化录入数据时,通过调用的办公脚本,基于所述任务内容中需要录入的特定信息,模拟对应的应用进行登录并识别验证码;按照所述任务执行频率循环读取第三数据库中的数据,通过css selector识别所述任务内容中各字段对应的元素,根据元素识别结果往录入对象逐个字段进行填写并校验。3.如权利要求2所述的一种基于用户需求的办公信息处理方法,其特征在于,所述基于所述任务类型,通过调用的办公脚本,执行相应的办公任务,还包括:当所述任务类型为PDF文件信息处理时,通过调用的办公脚本,将待处理PDF文档录入到第四数据库中,并转换为docx文件;基于所述任务内容中需要删除的特定信息,通过api操作,删除docx文件中所述需要删除的特定信息,并将经过删除处理的docx文件转换为处理好的PDF文件存储到所述第四数据库中。4.如权利要求1至3任意一项所述的一种基于用户需求的办公信息处理方法,其特征在于,所述将所述办公任务的执行结果进行可视化展示,具体为:获取所述办公任务的执行结果的关键字,通过爬虫程序采集所述关键字的关联信息;通过自然语言处理技术,对所述关联信息进行筛选;将经过筛选的关联信息进行可视化展示。5.如权利要求1至3任意一项所述的一种基于用户需求的办公信息处理方法,其特征在于,所述办公脚本通过python实现。6.一种基于用户需求的办公信息处理装置,其...
【专利技术属性】
技术研发人员:沈伟坤,莫勇华,黄创,钱奕舟,李思勤,梁清林,刘振雷,
申请(专利权)人:中捷通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。