Glossary

0-9

2-stage detector 9-layer network 5G + AI 0-shot learning 6DoF pose estimation 3D convolution 8-bit quantization 7D representation 1-shot learning 4D data

A

Algorithm Autoencoder AGI / Artificial General Intelligence Attention Artificial Intelligence (AI)

B

BERT Batch Normalization Backpropagation Bias Boosting

C

Chatbot Classifier / Classification CNN / Convolutional Neural Network Cross-Validation Clustering

D

Deterministic Model Discriminative Model Deepfake Data Augmentation Deep Learning

E

Epoch Encoder Ensemble Learning Embedding Explainable AI (XAI)

F

Foundation Model Feature Extraction Fusion / Multimodal Fusion Forward Propagation Fine-tuning

G

GAN / Generative Adversarial Network Generative AI Gradient Descent Grounding Graph Neural Network (GNN)

H

Hyperparameter Hidden Layer Hallucination Heuristic Hierarchical Model

I

Instance / Sample Instruction tuning Intelligence Amplification / Augmentation Interpretability Imbalanced Data

J

JAX Joint Embedding JSONL / JSON-lines Juxtaposition Jittering

K

Knowledge Distillation KL Divergence (Kullback–Leibler Divergence)K-means Clustering K-Shot Learning Kernel Trick

L

Large Language Model (LLM)Latent Variable Loss Function Learning Rate LSTM / Long Short-Term Memory

M

Model Machine Learning (ML)Meta-learning Multi-head Attention Multimodal / Multimodality

N

Neural Network Novelty Detection / Anomaly Detection NLP / Natural Language Processing NLU / Natural Language Understanding Normalization

O

Optimizer Online Learning Objective Function Overfitting One-hot Encoding

P

Parameter Prompt Policy / Reinforcement Learning Policy Pooling Pretraining

Q

Query Quality Estimation Quantization Q-learning Queue / Buffer

R

Representation Learning Reinforcement Learning (RL)Retrieval Augmented Generation (RAG)Regularization RNN / Recurrent Neural Network

S

Self-Supervised Learning Supervised Learning Sampling Sequence Modeling Softmax

T

Tokenizer Transfer Learning Transformer Tuning / Hyperparameter Tuning Training Data

U

Unsupervised Learning Uncertainty Estimation Underfitting Universal Approximation Theorem U-Net

V

Variational Autoencoder (VAE)Vector Embedding Validation Set Vanishing / Exploding Gradient Vision Transformer (ViT)

W

Weak Supervision Weight Decay Whitening / Whitening Transformation Word Embedding Workflow

X

X-axis / feature axis XOR problem XAI / Explainable AI XLM XLNet

Y

Y-axis / feature axis Yield (model yield / throughput)Yoga of AI Y-transform / YUV YAGNI (You Aren't Gonna Need It)

Z

Zero-shot Learning / Zero-shot inference Zero-centric / Zero-bias initialization Z-score Normalization Zygosity in augmentation Zero-gradient phenomenon

Qu'est-ce que la Validation Croisée

La validation croisée est une méthode statistique utilisée pour évaluer la performance et la fiabilité des modèles d'apprentissage automatique. L'idée principale est de diviser l'ensemble de données en plusieurs sous-ensembles et d'entraîner et de tester le modèle plusieurs fois pour évaluer sa capacité de généralisation. Cette technique est particulièrement utile pour résoudre le problème du surajustement, garantissant que le modèle développé fonctionne de manière robuste sur des données non vues.

Une des formes les plus courantes de validation croisée est la validation croisée K-Fold. Dans cette méthode, l'ensemble de données est divisé aléatoirement en K sous-ensembles, où K-1 sous-ensembles sont utilisés pour l'entraînement et le sous-ensemble restant pour le test. Ce processus est répété K fois, un sous-ensemble différent étant choisi comme ensemble de test à chaque fois. L'évaluation finale des performances du modèle est obtenue par la moyenne des résultats de tous les K tests. Il existe également des variantes telles que la validation croisée Leave-One-Out.

L'avantage de la validation croisée réside dans sa capacité à utiliser efficacement les données, surtout lorsque le volume de données est limité. En entraînant et en testant plusieurs fois, elle réduit l'aléa associé à la partition des données, augmentant ainsi la fiabilité de l'évaluation du modèle. Cependant, la validation croisée présente également des inconvénients, tels que des coûts de calcul élevés, en particulier avec de grands ensembles de données et des modèles complexes.

À l'avenir, la validation croisée pourrait être intégrée à la sélection automatisée de modèles et à l'optimisation des hyperparamètres pour améliorer encore la performance et l'efficacité des modèles d'apprentissage automatique. Avec l'augmentation de la puissance de calcul et le développement des technologies de big data, l'application de la validation croisée devrait devenir encore plus répandue.