走近信息科学2022期末珠海试卷20221220

什么是信息科学？科学与技术的关键区别？信息科学的三大支撑理论及其内涵是什么？

信息科学是研究信息运动规律和应用方法的科学，是由信息论、控制论、计算机理论、人工智能理论和系统论相互渗透、相互结合而成的一门新兴综合性科学。其支柱为信息论、系统论和控制论。信息科学是一个高度复杂的学科，它涉及许多具体的技术和理论，例如通信与网络、信息安全、算法与编程、视觉与图像处理等。它的应用领域也极其广泛，主要包括电子商务、社交媒体、医疗保健、能源分配、交通管理等。

科学与技术的区别在于：

目的不同：科学侧重于回答"是什么""为什么"的问题；技术侧重于回答"做什么""怎么做"的问题
任务不同：科学是认识自然、探索客观真理、揭示事物本质规律；技术是生产力，是改造自然，创造物质财富的手段和存储知识、获取信息的手段
知识形态不同：科学主要表现为一元性的知识，它将纷杂的现象统一于某一种本质，使其简洁明了；技术由单一到多样，它将某一种科学知识转化为多种技术设施、工艺手段，从相同的原理中做出多种类型的设计方案
选题方向不同：科学从科学理论与科学实验的矛盾、科学理论自身的矛盾中去寻找、发现和选择研究的课题，目的是从中发现新的现象和规律，要求具有理论学术意义，但不能要求在经济和社会生活中立见成效；技术主要从国民经济发展、国防建设需要、人民生活水平提高等实际需要中发现和选择所研究的课题，要求能付诸实施并产生一定的实际效益
成果形式不同：科学成果是观念形态的东西（科学发现/预见/原理）属于由物质向精神转化的范畴，其成果形式有专著、论文、研究报告等；技术成果是知识形态的东西与物质形态的东西的有机结合，更多地表现为由精神向物质的转化，其成果形式有技术样品、模型、技术规程、图纸等
知识的评价标准不同：对科学进行真理性评价；对技术进行价值性评价
管理方式不同：科学是由科学共同体通过制定行为规范来实施的，其管理是柔性的、松散的，科学是无国界的，它的知识是共有的、共享的，属于全人类；技术是由国家准里部门通过专利法保护的，这种管理是严格的、在一定时期是保密的，技术是有国界的，未经公司或政府许可时不能够输出的

总之，科学与技术的目的、任务、知识形态、选题方向、成果形式、知识的评价标准和管理方式都有所不同，科学与技术都是共同的，却又有所区别，互为补充，共同发展。

信息科学的三大支撑理论是控制论、信息论、系统论

系统论：系统论是一种以系统为基础的理论，它研究的是系统的结构特征、行为特征、复杂性等，以及系统的内部联系和外部环境关系、结构和行为之间的协调，以及系统的演化过程。它是由系统思维发展起来的，是一门关于系统思维方法论、系统分析方法论和系统设计方法论的科学。
信息论：信息论是一种理论，旨在研究信息的结构、表征、存储、传输和使用。它主要研究信息的本质，如信号的形式、信息的内容、信息的编码以及信号的传输等。
控制论：控制论是根据物理系统的机械装置，开发出来的一种理论，它旨在通过研究系统的性质，进行系统的调控，使系统运行稳定、准确、可靠。它主要研究受控系统的性质，控制系统的品质，如何实现达到期望的目标，以及如何对系统实施控制、补偿等。

什么是多传感器数据融合？数据融合的三个层次是什么？列举2-3个常用的数据融合方法。

多传感器数据融合是指将多个传感器收集到的多维数据进行组合以获得更准确的数据，从而更好地认识和模拟真实世界的方法和技术。

数据级融合：针对传感器采集的数据，依赖于传感器类型，进行同类数据的融合。数据级的融合不能处理异构数据
特征级融合：提取所采集数据包含的特征向量，用来体现所检测物理量的属性，这是面向监测对象特征的融合
决策级融合：根据特征级融合所得到的数据特征，进行一定的判别、分类，以及简单的逻辑运算，根据应用需求进行较高级的决策。决策级融合是面向应用的融合。

数据级融合比如图像处理中借助多重曝光实现的HDR，用同构的数据提升图像信噪比和宽容度（动态范围）
特征级融合比如机器学习领域的集成学习，用多个异构的学习器得到不同的特征，并对这个特征进行融合
决策级融合比如深度学习中的卷积神经网络，特征工程就是指对低级特征逐层提炼，得到高级特征的过程

简述虚拟现实、增强现实和元宇宙的含义，举例说明虚拟现实和增强现实的不同。

虚拟现实（VR）是利用技术手段将用户带到虚拟的环境中去进行实时交互的一种新兴的以可视化为基础的计算机技术；增强现实（AR）是一种把虚拟的物体及信息与真实的环境相结合的技术，让虚拟的信息可以融入到真实的世界中。

而元宇宙（Metaverse）是一种与虚拟现实和增强现实结合的概念，它把VR和AR技术用于建立一个多层次的三维虚拟环境，用户可以在其中实现完全虚拟的社交经济体验。元宇宙把VR和AR技术紧密结合，使用户可以在完全虚拟的环境里体验真实环境的一些感受，并与真实世界融合，使用户可以在虚拟世界里进行一系列的社交活动，而不必离开真实的世界。

元宇宙中的社交为用户提供更多的交流和互动体验，同时也可以为虚拟世界增添更多的感官元素，从而让用户在虚拟世界里享受更具实体感的体验。

VR和AR的异同：

相同点：都是建立在特殊环境里的计算机技术，都是可以让用户进入虚拟世界中进行实时交互。

不同点：VR是将用户带入完全虚拟的环境中，而AR是将虚拟的物体及信息融入到真实的世界中，用户可以与虚拟物体交互，但实际上没有改变真实的环境。

什么是知识图谱？若将文本数据转化为知识图谱，需要哪些自然语言处理技术？文本数据转化为知识图谱后，其价值会在哪些方面得到了提升？

知识图谱是一种形象化的、基于图形的计算机表示形式，它把有关各种实体和关系的知识以图形结构的方式连接起来，使得这些知识能够在自动化的方式被计算机解释和处理。知识图谱通常由多个节点和连接起来的边构成，用于存储有关关系的知识和信息。知识图谱可以为计算机提供一种更加系统的理解能力，以及更深层次的认知能力。它可以通过图谱的方式发现连接各个实体的关系，挖掘关系的结构和依赖性，最终形成一个完整的知识库。知识图谱的这种可视化形式和计算机的实现能力，可以帮助人们更容易地去理解事物间的关系，从而更好地建立更为有效的模型和算法。

要将文本转化为知识图谱，需要使用多种自然语言处理技术，其中包括词法分析、句法分析、细粒度分析、知识获取、语义理解等技术。

其中，词法分析指的是从文本中提取单词，并对单词进行原始形式的标记；句法分析指的是归类句子结构，对句中的词语进行深入的分析以了解句子结构；细粒度分析指的是对句子中的单词进行更深一步的分析，把单词分解成更有意义的语义单元；知识获取指的是把文本中的实体和关系从抽象的文本表达中抽取出来；语义理解指的是理解句子意思，分析出句子中实体之间的关系。

将文本转换为知识图谱后，其价值会在以下几个方面得到提升：

可视化：知识图谱的可视化形式可以使人们更容易理解文本内容的含义，从而更好地表达概念。
自动化：知识图谱为计算机提供一种更加系统地理解能力，能够更好地理解文本的意思，从而自动的完成繁重的工作，如知识抽取、理解和推理等。
可扩展性：知识图谱支持无限制地自然语言处理，可以从给定文本中提取出不断增长的知识和信息，从而使知识图谱不断变得更加全面。
可集成性：知识图谱不仅可以让人们更好地查阅和理解知识，而且还可以和其他技术如机器学习、大数据分析等技术集成，从而实现更多的价值。
最后，知识图谱还可以将各种数据进行有效的衔接，进而有效地实现多模态融合，从而实现新一代人工智能应用，如虚拟信息助理、问答系统、机器翻译等。此外，知识图谱还可以基于实体及其关系，使用强大的推理能力，解决从语义理解、对话建模、推荐系统到知识推理等方面的问题。

总之，知识图谱在构建有效的文本表示形式方面具有广阔的应用前景，可以更全面地理解文本内容，更好地挖掘信息，处理复杂的推理任务，为人工智能技术的发展提供更多的可能性。

简述人工智能发展的六个主要阶段，每个主要阶段的主流技术是什么？列举2-3个不同时期的代表性应用。

起步发展期：1956年-20世纪60年代初：简单的机器定理证明、跳棋程序
反思发展期：20世纪60年代-70年代初：具有挑战性的任务和不切实际的研发目标落空
应用发展期：20世纪70年代初-80年代中：特定领域的专家系统
低迷发展期：20世纪80年代中-90年代中：专家系统存在应用领域狭窄、缺乏常识行知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露
稳步发展期：20世纪80年代中-2010年：互联网技术加速了人工智能的创新研究，促使AI技术进一步走向实用化
蓬勃发展期：2011年至今：前沿技术联动，AI与其他科学交叉发展，不断在各领域实现重大突破，也不断映入大众视野。例如ChatGPT、stable-diffusion等

简述大数据的三个主要来源，解释其4V特性，列举2个大数据分析的典型应用案例。

大数据的三大主要来源是指开源数据、业务数据和线路数据。

开源数据包括了互联网数据、移动数据网数据，互联网平台和移动互联网平台通过采、编、发或者通过用户互动产生的数据，公之于众，供网民或用户访问、浏览。
业务数据产生于各单位的信息化系统中。在目前的单位业务系统中蕴含了大量的工作数据和交易数据，以及客户管理数据，包括交易数据、流水数据、记帐数据、借款数据、贷款数据等业务数据，这些数据构建了每天的系统日志，同时又是帐户余额、信用额度、购买能力等的有力补充，这些数据不仅对生产系统起到计费支撑作用，同时也是用户（银行客户、电力客户、担保公司等）进行相关决策的重要基础。
而线路数据是指在任何的网络行为都需要经过“线路”进行链接和交互，在这条线路上，要经过无数的路由交换得以完成，这条线路在完成链接的同时，也记录与存贮了大量的数据，我们统称为线路数据。

4V特性指Volume（海量数据）、Variety（多样化数据）、Velocity（快速更新）和Veracity（数据可信度）。

2个典型应用案例：

导航软件：分析路线拥堵的程度和天气情况，实时为用户推荐最快最安全的线路
翻译软件：需要先用大量的源语言和翻译后的目标语言配对来让神经网络学习规律

计算机视觉的四个关键技术环节是什么？介绍各个环节的典型处理技术，说明计算机视觉未来的发展目标。

分类、定位、检测、分割。

图像分类：KNN聚类、SVM支持向量机、BP神经网络、CNN卷积神经网络等
图像定位：匹配定位、投影定位等
图像检测：边缘提取、阈值选取、CNN等
图像分割：基于阈值的分割、区域生长法、分水岭算法、基于边缘检测的方法、基于小波分析和小波变换的方法、基于遗传算法的方法、基于主动轮廓模型的方法、基于深度学习的方法、基于区域选择的方法等

计算机视觉未来的发展目标是进一步提高准确率、实时性以及视野范围，不断优化模型、技术，对不同的图像进行精准的分析判断，更加准确地识别一系列复杂的图像，并将计算机视觉应用于实际领域。为此，需要运用机器学习、深度学习及其他人工智能领域的最新技术，如强化学习等，提供更高精度的算法，改进计算机视觉的处理能力。

步态识别在应用落地中有哪些挑战问题？解决这些问题的关键思路和路径是什么？

数据采集挑战：步态识别系统需要足够多的、高质量的数据来完成训练，而这些数据不容易采集和准备，另外还要考虑不同人群的差异，如身高、体重、性别等；
模型训练挑战：获得足够的步态数据后，模型的训练和优化是关键步骤，但是由于数据量的局限，很难构建具有广泛适用性的模型；
部署挑战：步态识别系统的实际部署需要考虑的因素比较多，这些因素包括：设备类型和型号、环境照明条件、安全性度量标准等；

解决这些问题的关键思路和路径：

利用现有数据集构建训练模型，并进行模型优化；
搭建大规模步态数据集，实现量化的步态参数，利用大数据分析技术，提升模型的性能；
收集千变万化的环境和设备信息，实现模型的环境适应性，提高模型实际部署的可用性；
通过模型融合、鲁棒学习以及视觉识别技术，提升模型的抗干扰性，增强系统安全性能。