
漢德百科全書 | 汉德百科全书
卷积神经网络(英语:convolutional neural network,缩写:CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,[1]对于大型图像处理有出色表现。
卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网络能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网络在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网络,卷积神经网络需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构[2]。
卷积神经网络的灵感来自于动物视觉皮层组织的神经连接方式。单个神经元只对有限区域内的刺激作出反应,不同神经元的感知区域相互重叠从而覆盖整个视野。
Interdisziplinarität (lateinisch inter ‚zwischen‘, disciplina ‚Unterweisung‘, ‚Lehre‘, ‚Ordnung‘, ‚Disziplin‘) bezeichnet die kooperative Nutzung und Weiterentwicklung von Ansätzen, Denkweisen oder Methoden[1] verschiedener wissenschaftlicher Fachrichtungen.
科际整合(英语:Interdisciplinarity),或译跨学科、交叉学科、学科间研究、学科交叉等,指的是两个或多个学科相互合作,在同一个目标下进行的学术活动。科际整合的项目通常源于对单一学科无法、或是无意对某些重要问题进行研究的认识。
LLaMA(英语:Large Language Model Meta AI)是Meta AI公司于2023年2月发布的大型语言模型。它训练了各种模型,这些模型的参数从70亿到650亿不等。LLaMA的开发人员报告说,LLaMA运行的130亿参数模型在大多数NLP基准测试中的性能超过了更大的、具有1750亿参数的GPT-3提供的模型,且LLaMA的模型可以与PaLM和Chinchilla等最先进的模型竞争[3]。
Das LLaMA (Large Language Model Meta AI) von Meta ist ein sogenanntes Großes Sprachmodell, das von Meta AI am 24. Februar 2023 veröffentlicht wurde.[1] Es ist ein generatives Sprachmodell, das in der Lage ist, menschenähnlichen Text zu erzeugen, Sprachen zu übersetzen, verschiedene Arten kreativer Inhalte zu schreiben und Fragen informativ zu beantworten.[2][3][4]
Midjourney是一个由位于美国加州旧金山的同名研究实验室开发之人工智能程序,可根据文本生成图像[2][3],于2022年7月12日进入公开测试阶段[4],用户可透过Discord的机器人指令进行操作[5]。该研究实验室由Leap Motion的创办人大卫·霍尔兹(David Holz)负责领导[6]。
Midjourney ist eine Anwendung von Künstlicher Intelligenz (KI), die in der Lage ist, KI-Kunst zu erschaffen. Das proprietäre Programm wurde am Forschungsinstitut Midjourney, Inc. in San Francisco, Kalifornien, USA, entwickelt. Midjourney, Inc. wurde von David Holz gegründet, der das Institut auch aktuell leitet.[1] Er war zuvor ein Mitgründer der Firma Leap Motion und arbeitete bei der NASA.
Benchmark-Details
Gebiet | Benchmark | Datensatz | Qualitätsziel | Referenzimplementierungsmodell |
---|---|---|---|---|
Vision | Bildklassifizierung | IMAGEnet | 75.90 % Einstufung | ResNet-50 v1.5 |
Vision | Bildsegmentierung (medizinisch) | KiTS19 | 0.908 Mittlerer DICE-Score | 3D-U-Net |
Vision | Objekterkennung (geringes Gewicht) | Öffnen Sie Bilder | 34.0 % Karte | RetinaNet |
Vision | Objekterkennung (schweres Gewicht) | KOKOSNUSS | 0.377 Box-Min.-AP und 0.339 Masken-Min.-AP | Maske R-CNN |
Sprache | Spracherkennung | LibriSpeech | 0.058 Wortfehlerrate | RNN-T |
Sprache | NLP | Wikipedia 2020 | 0.72 Mask-LM-Genauigkeit | BERT-groß |
Sprache | LLM | C4 | 2.69 Log Ratlosigkeit | GPT3 |
Geschäfte | Software Empfehlungen | Criteo 4 TB Multi-Hot | 0.8032 AUC | DLRM-dcnv2 |
The next frontier of AI is physical AI. NVIDIA Cosmos™—a platform of state-of-the-art generative world foundation models, advanced tokenizers, guardrails, and an accelerated data processing and curation pipeline—accelerates the development of physical-AI-embodied systems such as robots and autonomous vehicles.
The integration of Cosmos with NVIDIA Omniverse™ creates a sim-to-real synthetic data and multiverse simulation engine for physical AI. This enables the generation of every possible outcome for a given use case, providing physical AI systems with the foresight needed to make more accurate and informed decisions.
人工智能的下一个前沿领域是物理人工智能。NVIDIA Cosmos™ 是一个由最先进的生成世界基础模型、高级标记化器、护栏以及加速数据处理和整理流水线组成的平台,可加速机器人和自动驾驶汽车等物理人工智能嵌入式系统的开发。
Cosmos 与 NVIDIA Omniverse™ 的集成为物理人工智能创建了一个模拟到真实的合成数据和多元宇宙模拟引擎。这样就能为给定的使用案例生成每一种可能的结果,为物理人工智能系统提供做出更准确、更明智决策所需的前瞻性。