Glossary

0-9

1-shot learning 5G + AI 6DoF pose estimation 7D representation 8-bit quantization 2-stage detector 4D data 0-shot learning 9-layer network 3D convolution

A

AGI / Artificial General Intelligence Autoencoder Attention Algorithm Artificial Intelligence (AI)

B

Backpropagation BERT Boosting Batch Normalization Bias

C

Chatbot Clustering CNN / Convolutional Neural Network Cross-Validation Classifier / Classification

D

Deep Learning Deepfake Discriminative Model Deterministic Model Data Augmentation

E

Embedding Encoder Epoch Ensemble Learning Explainable AI (XAI)

F

Fine-tuning Fusion / Multimodal Fusion Forward Propagation Foundation Model Feature Extraction

G

GAN / Generative Adversarial Network Gradient Descent Grounding Graph Neural Network (GNN)Generative AI

H

Hyperparameter Heuristic Hidden Layer Hierarchical Model Hallucination

I

Imbalanced Data Interpretability Instruction tuning Instance / Sample Intelligence Amplification / Augmentation

J

JAX Jittering Joint Embedding JSONL / JSON-lines Juxtaposition

K

KL Divergence (Kullback–Leibler Divergence)K-means Clustering K-Shot Learning Kernel Trick Knowledge Distillation

L

Latent Variable Loss Function LSTM / Long Short-Term Memory Large Language Model (LLM)Learning Rate

M

Multimodal / Multimodality Machine Learning (ML)Meta-learning Model Multi-head Attention

N

Normalization Neural Network NLP / Natural Language Processing NLU / Natural Language Understanding Novelty Detection / Anomaly Detection

O

Objective Function Online Learning One-hot Encoding Overfitting Optimizer

P

Policy / Reinforcement Learning Policy Pooling Pretraining Prompt Parameter

Q

Queue / Buffer Quantization Q-learning Query Quality Estimation

R

Retrieval Augmented Generation (RAG)Representation Learning Reinforcement Learning (RL)Regularization RNN / Recurrent Neural Network

S

Supervised Learning Self-Supervised Learning Sequence Modeling Sampling Softmax

T

Training Data Tokenizer Transfer Learning Transformer Tuning / Hyperparameter Tuning

U

Universal Approximation Theorem Unsupervised Learning U-Net Underfitting Uncertainty Estimation

V

Variational Autoencoder (VAE)Vector Embedding Vanishing / Exploding Gradient Validation Set Vision Transformer (ViT)

W

Weak Supervision Weight Decay Whitening / Whitening Transformation Word Embedding Workflow

X

XOR problem X-axis / feature axis XAI / Explainable AI XLM XLNet

Y

Y-axis / feature axis Y-transform / YUV YAGNI (You Aren't Gonna Need It)Yield (model yield / throughput)Yoga of AI

Z

Z-score Normalization Zero-gradient phenomenon Zero-shot Learning / Zero-shot inference Zero-centric / Zero-bias initialization Zygosity in augmentation

Giải thích là gì

Giải thích là mức độ mà con người có thể hiểu nguyên nhân của một quyết định được thực hiện bởi một mô hình hoặc thuật toán. Trong các lĩnh vực trí tuệ nhân tạo và học máy, điều này ngày càng trở nên quan trọng khi sự phức tạp của các mô hình gia tăng.

Khi các mô hình trở nên phức tạp hơn, quá trình ra quyết định có thể giống như một 'hộp đen', khiến người dùng khó hiểu được cách mà các kết luận được đưa ra. Sự phức tạp này đã tạo ra sự quan tâm đối với nghiên cứu về khả năng giải thích, đặc biệt là trong các lĩnh vực rủi ro cao như y tế và tài chính, nơi mà tính minh bạch trong các quyết định của mô hình ảnh hưởng trực tiếp đến trách nhiệm đạo đức và pháp lý.

Các kỹ thuật để đạt được khả năng giải thích bao gồm phân tích tầm quan trọng của các đặc tính, công cụ trực quan hóa và các mô hình có thể giải thích cục bộ (như LIME và SHAP). Những công cụ này giúp người dùng hiểu được nền tảng của các quyết định của mô hình.

Với sự nhấn mạnh ngày càng tăng vào các quy định và tiêu chuẩn, đặc biệt là quy định về AI của EU, khả năng giải thích sẽ trở thành một khía cạnh quan trọng trong thiết kế và phát triển mô hình.

Mặc dù các lợi ích của khả năng giải thích bao gồm việc tăng cường độ tin cậy và tính minh bạch, nhưng việc quá chú trọng vào khả năng giải thích có thể hạn chế độ phức tạp và hiệu suất của các mô hình. Các nhà phát triển cần phải cân bằng giữa độ chính xác của các mô hình và khả năng giải thích của chúng để đảm bảo rằng người dùng cuối nhận được thông tin hữu ích.