摘 要
随着全球旅游业的快速发展,跨语言障碍成为游客在旅行中的一大难题。为了解决这一问题,开发一款名为“景点智能识别语言翻译”的App。这款App通过集成文字识别、机器翻译和语音合成技术,旨在帮助用户在旅行中轻松获取并理解景点介绍信息,消除语言障碍,提升旅游体验。为满足现代信息化时代对网上旅游的需要,本文利用最新的信息技术,研制开发了一款旅游景点智能识别语言翻译软件。首先,本文介绍了景点智能识别语言翻译管理系统的发展状况和发展背景,然后,讨论了该系统的设计目标、系统要求、整体设计方案,并对该系统的设计与实施进行了较为详尽的阐述,并对景点智能识别语言翻译管理系统做了具体的测试。
该系统利用 ANDROID技术构造了手机应用程序接口,并利用 JSP技术构造了网页接口,从而给了用户很好的人机交互体验。使用JAVA语言开发服务器端应用,处理用户请求、数据库操作等后端逻辑。使用Mysql数据库存储用户信息、帖子数据、系统配置等信息,确保数据的安全性和稳定性。集成翻译API和OCR模型,实现图片文字的实时识别和翻译功能,为用户提供即时、准确的翻译服务。
关键词:Android,景点智能识别语言翻译,OCR模型
随着全球旅游业的快速发展,跨语言障碍成为游客在旅行中的一大难题。为了解决这一问题,开发一款名为“景点智能识别语言翻译”的App。这款App通过集成文字识别、机器翻译和语音合成技术,旨在帮助用户在旅行中轻松获取并理解景点介绍信息,消除语言障碍,提升旅游体验。为满足现代信息化时代对网上旅游的需要,本文利用最新的信息技术,研制开发了一款旅游景点智能识别语言翻译软件。首先,本文介绍了景点智能识别语言翻译管理系统的发展状况和发展背景,然后,讨论了该系统的设计目标、系统要求、整体设计方案,并对该系统的设计与实施进行了较为详尽的阐述,并对景点智能识别语言翻译管理系统做了具体的测试。
该系统利用 ANDROID技术构造了手机应用程序接口,并利用 JSP技术构造了网页接口,从而给了用户很好的人机交互体验。使用JAVA语言开发服务器端应用,处理用户请求、数据库操作等后端逻辑。使用Mysql数据库存储用户信息、帖子数据、系统配置等信息,确保数据的安全性和稳定性。集成翻译API和OCR模型,实现图片文字的实时识别和翻译功能,为用户提供即时、准确的翻译服务。
关键词:Android,景点智能识别语言翻译,OCR模型
Abstract
With the rapid development of global tourism, the cross-language barrier has become a major problem for tourists to travel. To solve this problem, an App called "Scenic Spot Intelligent Recognition language Translation" was developed. By integrating text recognition, machine translation and speech synthesis technology, the App aims to help users easily access and understand information about attractions during travel, eliminate language barriers and improve the travel experience. In order to meet the needs of online tourism in the modern information age, this paper uses the latest information technology to develop a tourist attraction to identify the intelligent information language translation software. First of all, this paper introduces the attractions intelligent recognition language translation management system development and development background, and then, discusses the design of the system, system requirements, the overall design scheme, and the design and implementation of the system for the more detailed, and the attractions intelligent recognition language translation management system made the specific test.
The system uses ANDROID technology to construct the mobile phone application program interface, and uses JSP technology to construct the web interface, so as to give users a good human-computer interaction experience. Use JAVA language to develop server-side applications and process back-end logic such as user requests and database operations. Use the Mysql database to store user information, post data, system configuration and other information to ensure the security and stability of the data. Integrated translation API and OCR model, to realize the real-time recognition and translation function of pictures and text, to provide users with real-time and accurate translation service.
Keywords: Android, scenic spot intelligent recognition language translation, OCR model
1 绪论
1.1 选题背景及意义
随着全球化的深入发展,跨文化交流变得越来越频繁。旅游作为全球化的重要体现之一,吸引了越来越多的游客前往世界各地参观游览。近年来,移动旅游市场发展的日益火热吸引了越来越多的主体竞相加入到旅游类手机应用开发的浪潮中,但大多数软件的同质化都比较严重[1]。因此,一款能够实时翻译景点信息的APP对于满足游客的多元化需求至关重要。现代旅游强调个性化和体验性,游客在旅行过程中更加注重深入了解和体验当地文化。通过智能识别景点并提供相应的语言翻译,可以帮助游客更好地理解和欣赏不同文化背景下的景点内涵。随着人工智能、机器学习和图像识别等技术的快速发展,智能识别语言翻译已成为可能。这些技术为开发具有高精度和实时性的景点智能识别翻译APP提供了有力支持。传统的语言翻译工具往往需要用户手动输入或选择翻译内容,而智能识别语言翻译APP可以自动识别和翻译景点信息,大大提高了用户的便利性和体验。旅游业是一个持续增长的产业,随着旅游市场的不断扩大和消费者对旅游体验要求的提高,景点智能识别语言翻译APP的市场需求也将持续增长。一些国家和地区为了推动旅游业的发展,会出台相关政策支持旅游科技创新。开发这样的APP可以充分利用这些政策资源,促进旅游业与科技的有效结合。
综上所述,开发景点智能识别语言翻译APP具有重要的现实意义和市场价值,可以为游客提供更加便捷、个性化的旅游体验,同时也符合全球化趋势和行业发展的需求。
1.2 国内外研究现状
国内研究现状:
国内在人工智能、机器学习和图像识别等领域的技术研发上取得了显著进展。这为开发景点智能识别语言翻译APP提供了技术支持。一些研究机构和高校开始探索将这些技术应用于旅游领域,以实现更加智能化的旅游服务。随着国内旅游市场的不断扩大和消费者对旅游体验要求的提高,景点智能识别语言翻译APP的市场需求也在逐步增长。越来越多的旅游企业和开发者开始关注这一领域,投入资源进行研发和推广。
国外研究现状:
国外在人工智能、机器学习和图像识别等领域的技术研发上处于领先地位。一些国际知名的科技公司和研究机构已经开发出了先进的景点智能识别语言翻译技术,并成功应用于实际场景中。在国外,景点智能识别语言翻译APP已经得到了广泛的应用和推广。这些APP通常具备较高的翻译准确率和实时性,能够提供多样化的旅游信息服务,满足不同用户的需求。国外的旅游企业和科技公司注重与国际标准化组织合作,推动景点智能识别语言翻译技术的标准化和规范化。这有助于提高技术的通用性和互操作性,促进全球旅游业的发展。
综上所述,国内外在景点智能识别语言翻译APP的研究和开发方面均取得了一定的进展。然而,国内在技术研发和市场应用方面仍有待加强,可以借鉴国外的先进经验和技术成果,推动景点智能识别语言翻译APP的快速发展和广泛应用。
近几年来,由于语音、行为识别等方面的研究取得了长足的进步,使得OCR技术得到了越来越多的重视。mM,摩托罗拉,惠普,微软等公司相继进行了相关的研究,并且已经有大量的字符识别产品问世。随着文本识别技术的日益普及,模式识别等相关学科也得到了迅速的发展。
从1929年 Dausheck发明了光学字符识别的专利至今,经过了将近一个世纪的发展, OCR已经成为模式识别领域的一个热门课题。提出了一种基于计算机视觉信息的图像处理方法。OCR在经历了数十年的发展之后,已经有了长足的进步。目前国内外已有比较成熟的 OCR技术产品。传统的 OCR产品主要是对文字进行自动录入,而现代的 OCR产品在现实和计算机世界之间架起了一座桥梁。
当前,随着计算机技术的快速发展和性价比的日益提升,模式识别由理论研究走向了广泛的实用,并逐渐成为研究的热点。然而,目前计算机存储能力有限,计算复杂度有限,限制了它在实际应用中的实际应用。这种以实时为导向的模式识别问题,使平行加工神经网络被更多地用于模式识别,而文字识别就是其中的一个重要分支。
近年来,随着神经网络、模糊逻辑等理论的发展,各种新的研究手段层出不穷,为这门古老的学科注入了新的活力。目前,国际上对这一问题的研究已取得较多成果,涉及到模式识别领域的诸多典型问题:数据的获取与处理与选择,输入样本的选取,模式识别中的分类器的选择与导引。本文介绍了一种基于神经网络的汉字识别算法。神经网络具有良好的自组织自学习能力,泛化能力强,非线性强,计算快速等特点,被广泛地应用于工程实践中。
近二十年来,国内外学者对文字识别技术进行了深入的研究,并对不同类型的汉字进行了比较深入的研究,并成功地实现了对汉字的智能识别,准确率达到了96%。然而,对手写文本进行识别的研究还很不完善,仍然是一个极具挑战的问题一。
长期以来,人们都在使用传统的字符识别方法,这种方法的识别率一般只有96%左右,很难提高;但是,手写汉字的识别研究还处于探索阶段,识别率还比较低,亟需找到新的方法来提高汉字的识别率。
从90年代开始,人工神经网络(ANN)以其可以模拟人脑的某些抽象思考能力,在学习、记忆、推理等方面发挥着重要作用。特别是它在信息并行、分布式处理和自主学习等领域所具有的显著优势而受到人们的重视。ANN是由若干个简单神经元构成的神经网络.目前,已有许多人工神经网络和它们的学习算法, BP网络和它的学习算法得到了广泛的关注和研究,并在词识别等方面有了很大的应用。
1.3 本课题主要工作
本论文先对基本理论知识作了一定的介绍,然后对其作了较为系统的分析。在开发平台的过程中,系统分析是必不可少的一环,要想让这个系统更好更完整的被设计和实施,必须先进行深入的分析与研究。在对同类软件进行深入研究的基础上,对新软件的功能进行了详细的分析,为整个软件的研制和设计打下了坚实的基础。在此基础上,对项目建设方案进行了具体的分析,并对项目建设的可行性进行了研究。在软件上,我选用了现在很受欢迎的Android和 JSP技术,来进行开发管理平台的设计,在存储数据上,选用 MYSQL数据库,将翻译 API与 OCR模块相结合,能够对图文进行实时的识别与翻译,从而为用户提供及时准确的翻译服务。由于 Android, JSP, MYSQL等软件的发展十分成熟,所以它具有很强的安全性,实用性和可靠性。最后,完成该系统的测试和改进,并将其发布。
这个 APP仅需要用手机对景点简介信息图片进行拍照,并对图片中的文本信息进行智能识别,随后能够将文本信息进行英汉互译,最终利用语音识别技术将翻译好的信息广播出去[2]。
2 系统开发环境
2.1 JAVA技术
Java作为一种编程语言,可以跨平台应用,能够面向对象进行编写[3]在1995年, Sun公司发布了 Java程序语言以及 Java平台。Java技术具有很好的通用性、高效性、可移植性、安全性等特点,被广泛地用于计算机、信息中心、游戏主机、移动电话以及因特网等领域,并具有全球最大的专业社群开发团队。另外,在云计算、移动互联网等领域, Java的优势更加明显,发展前景也更加广阔。
Java包括4个部分: Java程序设计语言、 Java类文件格式、 Java虚拟机和 Java应用程序编程界面(即 Java API)。
Java平台包括 Java虚拟机(Java虚拟机,简称 JVM)和 Java应用程序编程接口(API),它是一种能够从操作系统中分离出来的、可从操作系统中分离出来的扩展部件和基础部件。Java已经被嵌入到了大部分的 OS中。因此, Java程序能够被编译一次,并且能够在各种系统上运行。JAVA平台以 java1.4为基础,目前使用最多的是 java1.7。
Java分为三个系统,包括J2SE,J2EE(Java2Platform,Enterprise Edition,java平台企业版),J2ME(Java 2 Platform Micro Edition,java平台微型版)。
Sun同时也发布了 Java编程语言的注释:相对而言, Java编程语言相对来说比较简单,面向对象,分布,安全,自组织。
Java平台基于 Java语言。这是一个非常受欢迎的平台。所以,微软和 C#一起开发了 NET平台,就像 Java一样。
2.2 Eclipse介绍
Eclipse是开源的软件。这就意味着 Eclipse不仅仅对用户开放,而且你还可以从其源码中了解到一项世界级的编程技术,同时还能与全世界的开发者分享对公共开放源码的贡献。
具有真实的可扩充性和可配置性。完整的 Eclipse平台是基于插件机制[4]的,在没有额外费用的情况下,删除起来相对简单。目前,网络上关于免费外挂的收费到处都是,在我国开发插件,正在全力进行中。
除了 Java之外,它还支援许多开发语言。它仅为开发人员提供了最小的可扩展性,而插件体系结构则允许 Eclipse对多种语言进行扩展。如果有合适的插件,相应的开发语言就能得到支持。到现在为止,已经有了对 C/C++、 COBOL、 Android、 Perl、 Python等多种语言的支持。(尽管 Eclipse主要由 Java控制,但它的结构保证了它能很好地支持其他编程语言)。
2.3 Android开发环境配置
2.3.1 jdk的配置
首先你得去 sun官方网站上下载 jdk,不过要小心,不要下载,因为 jre并不是用来运行 java,而是用 jre。
下载后安装的是解压软件包,把它解压缩到对应的文件夹里,这个目录可以自行设置,不过要注意在设置时要注意路径。
比如,解压缩的目录为: C:\程序文件\ JAVA\ JDI1.5.0_14
找到自己的计算机,右键找到属性,高级,在系统变量里设置环境变量,新建一个变量名,并在这个文件夹中输入一个JAVA_HOME变量的值。效果如图2.1所示:
图2.1 进入并修改环境变量
确定后,再建一个变量,名字为classpath,然后设定变量值,变量值为 %JAVA_HOME%/lib/rt.jar;%JAVA_HOME%/lib/tools.jar,再编辑path变量,具体如下图2.2所示:
图2.2 环境变量的设置
最后在 cmd中运行,如果出现对应的信息,说明运行成功了,如果没有,就检查一下变量和路径有没有问题,修正后再运行。请确保此处的路径正确无误。
2.3.2 sdk的配置
我们要进行一个android应用程序的项目开发,所以选中了Android studio工具来帮助我们进行开发,因为它本身是由谷歌推出的一个集成开发工具,所以我们需要从谷歌登录下边的网址:
http://developer.android.com/index.html来进入android主页,然后寻找到sdk的下载页面,选择自己电脑所适应的版本,去进行下载。下载之后解压到一个目录,如是D:\sdk, 下载安装完成之后我们也要继续设置环境变量,方法就像我们上边设置jdk配置时一样,新建一个变量,取名为ANDROID_SDK_HOME,变量值为D:\sdk ,之后我们需要找到path,对path变量进行修改,在其基础上增加%SDK_HOME%\tools; 到此我们sdk就算配置完成了。就像 jdk一样,还需要对环境变量进行测试,通过 cmd窗口中的 sdk来确定我们已经安装好了。
2.4 Android系统简介
2.4.1 安卓系统及其特点
Android是一个开放源代码,谷歌为手机上的操作系统。该系统采用 linux为核心,采用谷歌自有的 java虚拟机 dalvikjava虚拟机。
开源,Android系统是一个完全开放的体系,从底层到顶层都没有任何阻碍,所以,这一平台将会越来越普及,越来越多的人开始研发自己的Android系统。如果是那样,这个体系将会更加完善。
现在,三星、华为、小米等主要的手机制造商都开始提供自己的系统。
多样化, Android是一种操作系统,不仅仅适用于手机,还适用于电视,平板电脑,机顶盒等等,让用户的应用更加多样化。
除上述以外,安卓系统还有无界化、易用等等特点,作为最受欢迎的移动平台,据统计,安卓在 2023 年 9 月占据了市场的 70.5%[6]。
2.4.2 安卓系统的架构
Android 系统的整体架构可以分为 5 层,从下往上依次为 linux 内核驱动层、硬件抽象层、运行时支持库层、应用框架层、应用层,这些层在系 统中各司其职,共同构成了 Android 系统,保障了系统稳定性[5]。如图2.3所示。
图2.3 Android架构
2.4.3 Android运行时的组件
尽管 Android的开发采用了 java语言,但是它所执行的组件并不需要 java来运行。使用 Android,谷歌自己开发的,作为执行机构,运行一个部件。当 Android运行时,它的组件是由两大部分构成的:内核类库和 Dalvik虚拟机。
2.5 OCR模型
OCR (Optical character recognition)字识别是指一种电子装置对打印在纸张上的一个字符进行检验,并通过一个字符识别的方式将其转换为电脑单词的过程,也就是扫描一段文字数据,再对该图象文件进行分析和处理,从而获得一个单词和一个页面信息的过程[7]。构建一个高效准确的OCR模型需要经过以下几个步骤:
1. 数据收集:首先需要收集一个全面且具有多样性的OCR数据集。这个数据集应该包含各种字体、大小、背景、文字颜色和倾斜度的图像,以确保训练的OCR模型具有更好的泛化能力。这些数据可以从开放数据集、互联网资源和专门设计的数据采集系统中获取。
2.数据预处理:要提高 OCR模型的学习效率,就需要对其进行预处理。常用的预处理方法主要有图像灰度化、二值化、去噪和增强。通过以上几个方面的工作,可以使该模型对文本信息进行更好的识别。
3.模型的建立:OCR技术一般都是一个多级模型,包含了文本检测,检测框调整,文字识别等步骤。在此基础上,本文提出了一种新的方法,在该方法中,文字检测子模被用来对图像中的文字区域进行定位,而检测框调节子模型可以把文本框进行仿射变换到一个水平框上,并且可以判断出该文本的上、下两个方向。利用卷积神经网络(CNN)、循环神经网络(RNN)等深度学习算法,对其进行建模。
4. 模型训练:OCR模型的建立完成之后,要用样本来训练模型。训练过程中,模型会不断地学习和调整参数,以提高其对图像中文字信息的识别准确率。
5. 模型评估和优化:在培训结束之后,为了理解它在实践中的性能,必须对其进行评价。评价标准一般包括准确率,召回率,F1得分等。当模型性能较差时,可对模型结构进行调整,对算法及参数进行优化。
以上是OCR模型构建的基本步骤。需要注意的是,OCR模型的构建是一个复杂且需要不断迭代优化的过程,需要不断地尝试和改进才能获得更好的效果。
当前,以深度学习、神经网络为基础的OCR技术已经在图像处理、版式分析、文本特征提取、文本比对等方面得到了广泛应用,各大厂商都推出了统一的OCR技术,使常见汉字的识别率达到95%以上[8]。
3 系统分析
3.1 可行性分析
景点智能识别语言翻译管理系统主要目标是实现使用移动设备进行景点智能语音翻译。本文从四个方面对该体系是否能够达到预期的目的进行了可行性分析。
3.1.1 技术可行性
本文介绍了一种基于 Android平台、基于 MYSQL数据库的景点智能识别语言翻译管理系统。在建立和维护数据库时,必须建立一个数据完整性、安全性、稳定性好的类库。本文所研究的景点智能识别语言翻译管理系统,在技术上是可行的,而且开发人员也有一定的技能,可以满足实际需要。
3.1.2 操作可行性
景点智能识别语言翻译管理系统的登录界面很简单,使用一个通用的接口窗口来登陆界面,通过一台智能机器来实现,所以在日常生活中,任何使用过智能手机的用户都可以进行访问。本系统使用Android语言进行开发,在此基础上进一步完善了本系统。该系统操作简便,易于管理,具有良好的交互性和操作简便性。所以这个系统是可以被开发的。
3.1.3 经济可行性
景点智能识别语言翻译管理系统是利用 MYSQL数据库来存储数据,需要的软硬件环境在市面上都可以买到。因此,该项目对开发人员和资金的需求不大,并且该系统并不复杂,开发时间也比较短,从经济性上来说是可行的。
3.1.4 法律可行性
所开发的景点智能化语言翻译管理系统,是自主开发的一套管理系统,对旅游景点的发展有着重要的现实意义。不管是软件开发,语言开发,还是数据库开发,都用到了开源的代码,因此,在开发的过程中,与普通的系统软件有着很大的区别,不存在侵权的问题,也就没有了法律上的障碍。
总之,该系统在技术上,经济上,操作上,法律上都是可行的,因此,本项目的研制是非常有必要的。
3.2 系统流程设计
3.2.1 系统开发流程
在开发景点智能识别语言翻译管理系统时,首先要对它进行需求分析,其次是对它的总体设计,然后是它的功能模块,最后是它的各功能模块,如图3.1所示
图3.1 系统开发流程图
3.2.2 用户登录流程
为确保该系统的安全,利用该系统来管理商品信息,首先要登录该系统。如图3.2所示。图3.2 登录流程图
3.2.3 系统操作流程
当使用者进入这个系统之后,首先会出现一个登陆画面,在此页面上,你必须输入相应的用户名、密码,然后点击“登陆”,登录数据便会被传送到该系统,然后由系统核对注册信息,如果无误,则进入用户设置界面,然后继续进行后续的操作,若提示填写不准确,则无法登录。在此基础上,给出了景点智能识别和自动翻译管理的基本流程如图3.3所示。
图3.3 系统操作流程图
3.2.4 添加信息流程
系统管理员可以在系统中设置用户信息,板块分类,信息广告等功能。用户也可以根据自己的权限添加自己所拥有的资料,然后在上面填入自己想要添加的内容,系统会对其进行验证,如果符合,则添加到数据库中,如果是不行的话,就会提示失败,需要再重新填写一遍。添加信息流程如图3.4所示。
图3.4 添加信息流程图
3.2.5 修改信息流程
管理员在进入系统后,可以对相关的用户信息,板块分类,信息广告等进行修改。用户也可以在自己的权限内修改自己的数据,并将想要更改的资料输入进去,当录入之后,系统会对资料资料进行核实,如果无误,就会将资料更改到资料库中,如果是非法的话,就会提示失败,需要再次输入和更改资料。图3.5显示了修改信息的流程图。
图3.5 修改信息流程图
3.2.6 删除信息流程
管理者可以删除用户信息、板块分类信息、信息广告信息等信息,当对象信息被选定之后,点击“删除”按钮,系统便会提示是否删除该信息,若决定删除,则删除该信息,同时系统的数据库也会删除相关信息,如图3.6所示。
图3.6 删除信息流程图
3.3 系统用例分析
3.3.1 管理员用例图
该系统以系统管理员为中心,在管理员登陆后,通过管理员菜单对其进行管理。实现了用户管理,版块分类管理,帖子分享管理,沟通反馈管理,广告信息管理等。管理员用例如图3.7所示。
图3.7 管理员用例图
3.3.2 用户用例图
用户进入系统可以进行首页信息查看、实时翻译、我的等。用户用例如图3.8所示。
图3.8 用户用例图
4 系统设计
4.1 系统概述
本文介绍了一种面向互联网的景点智能识别语言翻译管理系统。任何时候,任何地方,只要你能上网,你就可以随时随地使用它。系统工作原理图如图4.1所示:
图4.1 系统工作原理图
4.2 系统结构设计
对一个系统架构的整体设计,是将一件庞大的工作拆分为多个小任务,并将其进一步细分,最终构成一个整体。它采取以下步骤开展工作:
1、系统被分解多个子模块
2、预先设计各个子模块的功能
3、设计各个子模块之间的逻辑关系
4、对各个模块的界面,还有模块间信息传输进行设计
从确定可行的具体方案到每个小的最后目标,都需要知道与之相关的某些需求信息。在此基础上,通过逐步优化,最终形成了一个可实施的体系结构。
景点智能识别语言翻译管理系统的整体结构设计如图4.2所示。
图4.2 系统结构图
4.3 数据库设计
数据库是计算机信息系统的基础。对数据库进行分类、检索、采集、处理、存储、更新、统计、推广等工作,均需要数据库系统的支撑。数据库是计算机系统的核心和核心。数据库的开发程度对整个系统的运行效率和运行速度有很大的影响。
对于一个系统和严谨的工程,数据库的安全设计是非常重要的,开发者必须对可能影响到数据库安全的因素进行全面的分析,并将其一一列出,并采取行之有效的方法,从根源上将各种可能的数据库安全问题都给解决掉[9]。
4.3.1 数据库设计原则
概念设计的方法大致有四种:
使用自顶向下、自底向上、层层拓展、混和的策略,将每一个由下而上的策略所设计的局部概念架构纳入架构。
在物理结构的设计阶段,首先要做的是:
在此基础上,提出了一种面向对象的数据库系统,并对其存取方法及存储结构进行了研究。评价物理结构最重要的要素是:空间的效率与时间。
其中,最常用的方法是采用存取索引、聚类、 HASH等方法。
4.3.2 数据库实体
在这个阶段,通过用户的评价和参与,保证数据库能够满足用户的需求。在这些方法中,最常见的是E-R模型。
然后,按照发展模式与体系概念模式的特点,建立了一种E-R模式:
1、用户信息实体E-R图如图4.3所示:
图4.3 用户信息实体图
2、反馈实体E-R图如图4.4所示:
图4.4 反馈实体图
3、资讯广告实体属性图如图4.5所示:
图4.5资讯广告实体属性图
4、帖子实体属性图如图4.6所示:
图4.6 帖子实体属性图
4.3.3 数据库表设计
数据库的设计依据,一般都是现有的 DBMS, SQL SERVER, MYSQLORACLE等。本景点智能识别语言翻译管理系统,采用了MYSQL数据库管理系统,下面介绍数据库中的各个表的详细信息。
表4.1 user用户信息表
列名 | 数据类型 | 长度 | 主键 | 允许空 | 说明 |
id | int | 11 | 是 | 否 | 编号 |
username | varchar | 50 | 否 | 否 | 用户名 |
passwd | varchar | 50 | 否 | 否 | 密码 |
roletype | varchar | 50 | 否 | 否 | 身份 |
varchar | 50 | 否 | 否 | 邮箱 | |
tel | varchar | 50 | 否 | 否 | 电话 |
sex | varchar | 50 | 否 | 否 | 性别 |
birth | varchar | 50 | 否 | 否 | 生日 |
img | varchar | 50 | 否 | 否 | 头像 |
favs | varchar | 50 | 否 | 否 | 收藏集合 |
openid | varchar | 50 | 否 | 否 | openid |
tags | varchar | 50 | 否 | 否 | 标签 |
fids | varchar | 50 | 否 | 否 | 好友关注集合 |
note | varchar | 50 | 否 | 否 | 备注 |
表4.2 tbl_posts反馈表
列名 | 数据类型 | 长度 | 主键 | 允许空 | 说明 |
id | int | 11 | 是 | 否 | 编号 |
title | varchar | 255 | 否 | 是 | 标题 |
note | varchar | 255 | 否 | 是 | 内容 |
uid | varchar | 255 | 否 | 是 | 用户id |
username | varchar | 255 | 否 | 是 | 用户名 |
ndate | varchar | 255 | 否 | 是 | 更新日期 |
img | varchar | 255 | 否 | 是 | 封面图 |
type | varchar | 255 | 否 | 是 | 类型 |
表4.3 tbl_notice资讯广告表
列名 | 数据类型 | 长度 | 主键 | 允许空 | 说明 |
id | int | 11 | 是 | 否 | 编号 |
title | varchar | 255 | 否 | 是 | 标题 |
note | varchar | 255 | 否 | 是 | 内容 |
ndate | varchar | 255 | 否 | 是 | 更新时间 |
type | varchar | 255 | 否 | 是 | 类型 |
img | varchar | 255 | 否 | 是 | 封面图 |
表4.4 tbl_blog帖子表
列名 | 数据类型 | 长度 | 主键 | 允许空 | 说明 |
id | int | 11 | 是 | 否 | 编号 |
title | varchar | 255 | 否 | 是 | 标题 |
note | varchar | 255 | 否 | 是 | 内容 |
ndate | varchar | 255 | 否 | 是 | 日期 |
btype | varchar | 255 | 否 | 是 | 大分类 |
img | varchar | 255 | 否 | 是 | 图片 |
video | varchar | 255 | 否 | 是 | 视频附件 |
typeid | varchar | 255 | 否 | 是 | 分类id |
typecn | varchar | 255 | 否 | 是 | 分类名称 |
uid | varchar | 255 | 否 | 是 | 发布者id |
username | varchar | 255 | 否 | 是 | 发布者姓名 |
favcount | varchar | 255 | 否 | 是 | 收藏次数 |
zan | varchar | 255 | 否 | 是 | 点赞次数 |
address | varchar | 255 | 否 | 是 | 地址 |
cai | varchar | 255 | 否 | 是 | 踩次数 |
fenxiang | varchar | 255 | 否 | 是 | 分享次数 |
statecn | varchar | 255 | 否 | 是 | 状态 |
latitude | varchar | 255 | 否 | 是 | 纬度 |
longitude | varchar | 255 | 否 | 是 | 经度 |
5 系统实现
5.1 系统管理员功能模块的实现
5.1.1 管理员登录界面
管理员输入用户名、密码,执行登录。如图5.1所示。
图5.1 系统管理员登录界面
5.1.2 用户管理界面
系统管理员可以添加、修改、删除用户信息。其界面如图5.2所示。
图5.2 用户管理界面
5.1.3 帖子分类管理界面
系统管理员能够完成对贴子分类的添加、删除、查找等操作。其界面如图5.3所示。
图5.3 帖子分类管理界面
5.1.4 发帖分享管理界面
系统管理员能够检查用户所发布的文章,并对其进行管理。其界面如图5.4所示。
图5.4 发帖分享管理界面
5.1.5 前端技术实现
在这次的前端网页的开发中,使用了以下三种主要的技术: HTML, CSS, JavaScript。
HTML (超文本标注语言): HTML是构成页面结构与内容的最基本的基本要素。它用一组标签(< div>,< p>,< img>等)对页面进行了定义。目前,HTML5已经被广泛应用,并且添加了诸如支持多媒体,本地存储等很多新功能。
CSS (stack-style table): CSS是一种用来控制页面风格和布局的工具。利用 CSS工具,开发人员可以完成各种各样的网页设计。CSS选择器(例如类别选择器, ID选择器)是用来选择并套用风格规则的.布局技术,例如 Flexbox,网格布局等,被用来创造一个反应灵敏的网页布局。
JavaScript: JavaScript是一种可以提高 Web页面互动性和动态性的脚本语言。JSP技术的实质是动态 web技术,其使用原则是在传统的 web HTML文件中插入 Java程序片段和 JSP标签,得到 JSP文件,方便工作人员进行后续工作[10]。
5.2 用户功能模块的实现
5.2.1 登陆界面
用户需要登陆后,才可以进入景点智能识别语言翻译APP。如图5.5所示。
图5.5 登陆界面
5.2.2 首页界面
用户登录成功后,就会直接跳到主页面,在这个界面中,使用者可以看到别人发表的贴子信息,对我的收藏、贴子信息进行管理,其界面如图5.6所示。
图5.6 首页界面
5.2.3 发布帖子界面
用户可以在网上发表文章,也可以管理自己的文章。其界面如图5.7所示。
图5.7 发布帖子界面
5.2.4 实时翻译界面
实时翻译,包括景点图片文本的识别,景点文本的英汉互译,景点信息的语音播放。其界面如图5.8所示。
图5.8 实时翻译界面
5.2.5 功能模块实现技术
在数字化浪潮中,文字处理成为了各行各业的基础需求。百度OCR文字识别技术,作为一款先进的文字识别引擎,利用深度学习技术,实现了对图像中文字的高效识别。这一技术不仅提高了文字处理的效率,也为智能化应用提供了强大的支持。
OCR技术的核心优势:
高准确率:通过深度学习算法,百度OCR在多种场景下实现高精度的文字识别,准确率可达90%以上。
多语言支持:百度OCR技术不但支持中文和英文,而且也支持日文,韩文等多个语种的文字识别。
快速识别:通过优化算法和底层架构,百度OCR实现了高速的文字识别,满足实时性的需求。
强大适应性:百度OCR能够适应不同分辨率和质量的图像,即使在模糊、倾斜、遮挡等情况下的文字也能够进行有效识别。
集成OCR技术到应用中:
申请百度人工智能平台:开发人员首先要在百度人工智能公开平台上注册一个帐号,然后建立一个程序来获得一个 API密钥[11]。
选用适当的 API:针对不同的应用场合,选用适当的 OCR API,例如:通用字符识别,身份证识别,汽车牌照识别等。
整合 SDK或者调用 API:如果是手机或者台式机,你可以把百度的 OLEDSDK整合到一起。在网络应用中, OCR API接口可以被直接调用。
实现商业逻辑:通过 OCR API界面,对要识别的图像进行上载,对 API的检测结果进行处理,对已识别的文本进行抽取。
百度翻译API:实现实时语言转换
随着全球化的推进,实时语言翻译成为了连接不同语言用户的关键技术。百度翻译API,一款基于深度学习的翻译服务,为开发者提供了强大的翻译能力。软件开发者只需调用一个翻译 API,输入要翻译的内容,然后选择要翻译的源语言(支持对源语言的智能识别)以及目的语言的类别,即可获得对应的翻译结果。
转换 API的主要功能如下:
精准翻译:百度翻译 API采用了高级人工神经网络的翻译方法,可以达到高品质的译文。
支持多语种:百度翻译 API支持中文,英文,日文,韩文等多个语种的翻译。
速度快:百度的翻译 API可以在很短的时间内,通过对算法及基础结构的优化,实现了多种语种的自动翻译。
易整合:百度提供便捷的 API界面,让开发人员能够很容易地把翻译技术整合进自己的程序。
为应用程序整合转换 API:
申请百度人工智能平台:开发人员首先要在百度的人工智能公开平台上注册一个帐号,然后建立一个软件,然后才能获得一个 API钥匙。
选用适当的 API:根据实际情况,选用适当的翻译 API,例如:文本翻译,语音翻译等。
整合 SDK或者调用 API:如果是手机或者台式机,你可以把百度的 SDK整合到一起。在网络应用中,翻译 API界面可以被直接调用。
实现商业逻辑:对程序中的转换 API进行调用,对要翻译的文本进行传送,并对所得到的结果进行处理。
在现今飞速发展的数码时代,即时广播已经成为许多应用系统的重要要求。百度的声音合成,具有很强的声音处理能力,可以让开发人员在短时间内,就可以把文字变成一种流利、自然的声音。语音合成是一种通过电脑程序产生声音的技术。简单的说,就是在电脑中分析和处理已经存在的语音样本和语音库,从而产生新的语音信息。
百度语音合成技术的优越性
快速准确:百度的语音合成是建立在深度学习的基础上,在保证较高精度的前提下,有效地把文字转换成声音[13]。
流畅自然:声音自然流畅,与真人发音十分接近,带给使用者更好的听觉感受。
多语种支援:提供中文,英文,日语,多语种的文字转换,以适应不同使用者的需要。
容易整合:百度提供了一个简单易用的 API界面,让开发商能够迅速地把声音合成到他们自己的程序里。
实时广播的实现
百度云端注册:首先要在百度云计算平台上注册一个帐号,然后建立一个申请,然后才能获得一个 API密码。
百度云平台上的声音综合服务,获得相应的 API密码及界面信息。
整合声音合成工具包或调用 API:
如果是针对手机或者台式机,你可以把百度的声音合成 SDK整合到一起。
在网络应用中,声音合成 API界面可以被直接调用。
实时播放逻辑:
在程序中调用声音合成 API界面,实现要广播的文字上载。
处理 API传回的声音资料,并向使用者播放。
6 系统测试
软件设计的最终阶段就是系统测试,主要用来检验软件的性能,质量,安全等,满足使用者的需求。软件可靠性测试就是实现对用户持续使用需求的一种测试,通过测试来发现和修正软件中存在的问题,从而提升软件的可靠性[14]。一系列合乎规范的测试流程,可以极大地提升软件的可靠性、质量和可信性,降低使用者的冒险因子,降低错误率。自动化测试工作主要是利用特定设计语言编制自动化测试程序,用于分析软件系统种类及应用对象[15]。 系统测试一般分为功能测试,性能测试,可用性测试,安全性测试等等。
为了更加稳定的运行本软件,我对软件做了全方面的测试,分为功能测试和界面测试。
首先,对界面进行了测试,这个界面的目的就是为了让您的程序能够在多种操作系统下正常工作,同时又能够保留原有的样式。实验表明,本软件能较好的实现图像、文本等操作界面的维护。没有扭曲!
其次,我们要验证该制度的作用。该系统采用了全面检测、单元检测和完善性检测等多种方式进行测试。
单元测试:分别对各模块(图像识别、语言翻译等)进行单独测试,保证各模块可独立工作,并能正常工作。
集成性测试:测试系统中各个模块间的相互作用及数据传输,以保证总体功能的一致性与完备性。
系统测试:在一个真实的环境下,仿真一个用户的使用方案,对整个软件的功能和表现进行测试。
回归测试:在每一次更新或者修正缺陷之后,都会重新执行前面的测试案例,以确定新的程式码不会带来新的问题。
自动测试工具:例如 Selenium, Appium等,实现了测试案例的自动运行,从而提高了测试的效率。
效能测试工具:例如 JMeter,它是用来模拟高并发性使用者存取、效能测试的。
使用者回馈工具:例如 Hotjar, SurveyMonkey等,用以搜集使用者的意见,并对使用者的体验进行分析。
6.1系统测试的意义
测试的定义:测试的目标是发现错误,并执行该步骤的过程。测试的任务和用途可以表示为:
目的:找出手术过程中存在的问题;
目的:在电脑上执行程式,找出程式中的隐患。
另一个与预报相关的词称为纠错。它的宗旨和授权可如下所述:
目标:发现并改正错误;
目的:使软件失效,以确保程序的可靠运行。在图6.1中,可以看出测试和错误校正的关系。每一次系统测试都要准备大量的试验资料,这样就可以连同被测的程序送到电脑上去执行指令。通常,我们将程序运行一次所需的测试资料称为“测试案例”。每个测试都会生成一个对应的“测试结果”。但如果测验的结果和“期望结果”不符,这意味着程序中确实有问题,等着我们去发现和纠正。
图6.1 测试与纠错信息流程
6.2 性能测试
性能测试是在仿真的系统环境下进行的,看看是否符合用户的需求。在此基础上,提出了一种新的网络性能评价方法,即系统的运行速度,网络的响应时间,同时还可以支持多个节点。
1、系统运行速度:该系统在不同配置的计算机上运行,无迟滞现象。
2、网络响应时间:网络响应时间是指在系统工作过程中所占用的时间,包括网络最短对应时间、平均响应时间和最大响应时间三个参数。经过测试,三个参数均为:2/3/6秒,在正常网络状态下,既能达到使用者的正常使用需求,又能在使用者的心理承受范围内。
3、支持多个并发节点:经过模拟试验,在55个节点并行的情况下,系统在10秒钟左右的时间内有较大幅度的波动,达到了用户需求。
6.3 测试分析
本系统汲取了国内外优秀旅游景点的优点,从界面到系统的设计都非常方便。该体系的主要特点和优点概括如下:
(1)本系统的应用具有较高的移置性和针对性,因为它具有较好的性能,并且它的可移植性可以在多个系统间运行,更方便了用户。
(2)景点智能识别语言翻译管理系统包含了丰富的信息,便于管理,能对各类错误、异常进行及时、综合的处理,从而有效地防止了由于顾客粗心大意造成的错误,它的使用简便,具有良好的人机界面,只要是能上网的人都能熟练地使用。
通过对该系统的整体测试与分析,本系统能够很好地满足用户的需求。具有完善的功能、简便的操作、优良的工作性能,为企业的发展提供了一条光明的道路。
6.4 测试用例
测试目的:
验证App在各种场景下的功能是否正常,包括文本识别、语言翻译、语音播报等,并对之前发现的问题进行复测以确保已解决。
测试环境:
操作系统:iOS/Android
设备型号:iPhone X/Samsung Galaxy S10
App版本:v1.0.1(修复版)
网络环境:Wi-Fi/4G
语言设置:自动/中文/英文/其他
测试用例及问题解决详见表6.1
表6.1 测试用例表
序号 | 用例名称 | 执行步骤 | 预期结果 | 实际结果 | 改进措施 | 改进结果 |
1 | 登录功能 | 用户输入账号密码进行登录 | 登陆成功 | 登陆成功 | 无 | 无 |
2 | 文本识别功能 | 用户点击图片识别功能进行使用 | 图片文字能被正确识别出来 | 图片文字大多能被正常识别显示 | 改进相关算法调用 | 识别正确率获得提高 |
3 | 语言翻译功能 | 用户点击图片识别功能后自动进行 | 识别的文字能被正确翻译 | 识别文字被正确翻译 | 无 | 无 |
4 | 多语种识别翻译功能 | 用户使用多种不同语言文字进行识别 | 能被正确识别并翻译 | 少数语言能被正确识别并播报 | 更改调用算法尽量支持更多种语言 | 支持了更多语言的识别翻译 |
5 | 语音播报功能 | 识别翻译完成后用户点击播放按钮 | 翻译结果能被正确播放 | 翻译结果可以被正确播放,但声音会比较机械化 | 修改语音合成代码使其相对柔和 | 语音播放变得相对柔和 |
6 | 分享功能 | 用户可以自行上传风景图片进行分享 | 图片能被正常分享上传 | 图片可以被正常分享上传 | 无 | 无 |
7 | 查看功能 | 用户可以点击别人分享内容进行查看评论 | 可以正常进行查看和评论 | 可以正常进行查看和评论 | 无 | 无 |
7.结论
本系统通过对Android和MYSQL数据库的简介,并集成翻译API和OCR模型,实现图片文字的实时识别和翻译功能,为用户提供即时、准确的翻译服务,通过本次景点智能识别语言翻译管理系统的研究与实现,我感到,任何一项新的技术,最重要的就是实践,唯有亲自体验,才能快速的掌握。要想吸引更多的用户,就必须使其界面美观、个性、友好、功能完备。
由于之前对Android的了解不够,所以一开始就碰到了许多的困难,例如一开始的时候,页面的显示不正常,数据库的连接有问题,所以无法进行参数的传递,但是通过网上的查询,再加上同学的帮忙,最后都得到了解答,在这一过程中,我学到了很多,也加强了自己的解决问题的能力,尤其是在大量的信息中,我们可以选择自己想要的东西,而且,我越来越意识到,虽然书本上的知识大部分都是有价值的,是正确的,但每个人的编程思维、对数据处理的方法和思路都是不同的,这就要求我们在实际工作中寻找解决问题的办法。在此过程中,我得到了许多宝贵的经验,相信这些经验会对我未来的发展有所帮助。
在本次景点智能识别语言翻译管理系统的开发过程中,本人从众多有关的系统范例中吸取其长处,逐步完善,但是仍然有很多不足之处,有待于进一步的完善。
实践证明,本系统具有良好的实用价值。本系统具有良好的人机界面、灵活的操作、简单的操作、完善的功能和独特的显示方式,已具备相对成熟的技术原理。
参考文献
[1] 成岑.基于用户偏好的旅游类手机应用开发研[D].上海:华东师范大学, 2015.
[2] 陆公正,刘阅兵,周诗竣等.景点智能识别语音翻译 APP 的设计与实现[J].福建电脑,2021, 37(11): 84.
[3] 李程,胡五音.Java编程语言在计算机软件开发中的应用[J].电子技术,2024,54(03):1.
[4] 陈玮彤,黄天一等.自主可控环境下的集成开发环境[J].现代计算机,2022,28(7):2.
[5] 史银凤.安卓应用合规性检测方法研究[D].四川:电子科技大学,2023.
[6] 吕轶霄.基于CSP的安卓系统组件间通信机制的形式化建模与验证[D].上海:华东师范大学,2023.
[7] 王睿,林凯.基于神经网络的OCR技术在自动阅卷系统中的应用研究[J].现代计算机,2024,30(06):1.
[8] 章倩,王梓祺.基于自定义模板的OCR技术及应用[J].指挥信息系统与技术,2023,14(05)L:2.
[9] 徐亮.软件开发中的数据库设计问题研究[J].无线互联科技,2023,20(15):1.
[10] 徐建林.基于JSP的图书馆管理系统的设计与实现[J].长江信息通信,2022,35(08):1.
[11] 杨民峰,孙洪迪.基于百度AI开放平台的植物识别设计与实现[J].北京工业职业技术学院学报, 2023,22(04):2.
[12] 郝二伟.基于百度云服务的在线翻译软件实现技术研究[J].数字通信世界,2019(12):1.
[13] 张浩华,柴欣等.基于行空板虚拟语音助手的设计与实现[J].沈阳师范大学学报(自然科学版),2023,41(06):1.
[14] 杨华晖,杨萍等.基于系统状态特征分析的软件可靠性评估方法[J].计算机仿真,2024,41(03):1.
[15] 温杏.持续集成中自动化测试的设计与实现[J].无线互联科技,2024,21(09):1.