MVEP - Multi-View Partial Erasure Pattern Dataset MVEP - Multi-View Partial Erasure Pattern Dataset MVEP - マルチビュー部分消去パターンデータセット

Dataset dédié à l'inspection automatisée de conteneurs en verre avec annotations multi-vues Dataset dedicated to automated glass container inspection with multi-view annotations マルチビューアノテーション付きガラス容器自動検査専用データセット

16,452
Images Images 画像
1,371
Scènes Scenes シーン
12
Caméras Cameras カメラ
5
Classes Classes クラス
5
Patterns Patterns パターン

🖼️ Aperçu du Dataset Dataset Overview データセット概要

MVEP Dataset Overview

Illustration des composants du dataset : différents patterns visuels appliqués sur les conteneurs, points de vue des caméras, positions des conteneurs (Bottom, Middle, Top), et exemples représentatifs des cinq classes d'effacement. Illustration of dataset components: different visual patterns applied to containers, camera viewpoints, container positions (Bottom, Middle, Top), and representative examples of the five erasure classes. データセットコンポーネントの図:容器に適用されたさまざまな視覚パターン、 カメラの視点、容器の位置(Bottom、Middle、Top)、および5つの消去クラスの代表例。

📖 Introduction Introduction はじめに

Le développement de méthodes robustes d'inspection nécessite des datasets qui reflètent fidèlement les contraintes rencontrées dans les environnements industriels réels. Dans le contexte de l'inspection de conteneurs en verre, les datasets publiquement disponibles restent rares et mal adaptés aux défis spécifiques de l'analyse de dégradation de surface sur des matériaux transparents.

Dans les environnements industriels, les acquisitions d'images impliquent souvent des conteneurs de marque portant des logos, des blasons en relief ou des éléments visuels propriétaires. Par conséquent, les datasets collectés à partir de lignes de production réelles ne peuvent pas être rendus publics en raison de contraintes de confidentialité et de propriété intellectuelle.

Pour répondre à cette limitation, nous introduisons le Multi-View Partial Erasure Pattern on Transparent Container Dataset, un dataset publiquement partageable conçu pour reproduire les principaux défis visuels et géométriques de l'inspection industrielle des rayures tout en évitant le contenu sensible. Le dataset est composé de conteneurs en verre sans logos ni marquage, sur lesquels des patterns d'effacement synthétiques sont appliqués. Ces patterns émulent les marques d'abrasion observées dans les usines réelles, avec des formes, des emplacements spatiaux et des degrés d'effacement variés.

Bien que la diversité des formes de conteneurs et des éléments décoratifs soit intentionnellement réduite par rapport aux données du monde réel, les contraintes de détection et de classification restent proches des conditions industrielles, notamment grâce à l'utilisation d'étiquettes ordinales de sévérité d'usure.
The development of robust inspection methods requires datasets that faithfully reflect the constraints encountered in real industrial environments. In the context of glass container inspection, publicly available datasets remain scarce and poorly adapted to the specific challenges of surface degradation analysis on transparent materials.

In industrial settings, image acquisitions often involve branded containers bearing logos, embossed blazons, or proprietary visual elements. As a result, datasets collected from real production lines cannot be publicly released due to confidentiality and intellectual property constraints.

To address this limitation, we introduce the Multi-View Partial Erasure Pattern on Transparent Container Dataset, a publicly shareable dataset designed to reproduce the core visual and geometric challenges of industrial scuffing inspection while avoiding sensitive content. The dataset is composed of glass containers without logos or branding, onto which synthetic erasure patterns are applied. These patterns emulate abrasion marks observed in real factories, with varying shapes, spatial locations, and degrees of erasure.

While the diversity of container shapes and decorative elements is intentionally reduced compared to real-world data, the detection and classification constraints remain close to industrial conditions, notably through the use of ordinal wear-severity labels.
堅牢な検査手法の開発には、実際の産業環境で遭遇する制約を忠実に反映するデータセットが必要です。ガラス容器検査の文脈では、公開されているデータセットは依然として少なく、透明材料の表面劣化分析の特定の課題に適応していません。

産業環境では、画像取得にはロゴ、エンボス加工された紋章、または独自の視覚要素を持つブランド容器が含まれることがよくあります。その結果、実際の生産ラインから収集されたデータセットは、機密性と知的財産の制約により公開できません。

この制限に対処するため、Multi-View Partial Erasure Pattern on Transparent Container Datasetを導入します。これは、機密コンテンツを回避しながら、産業的な擦り傷検査の主要な視覚的および幾何学的課題を再現するように設計された、公開可能なデータセットです。データセットは、ロゴやブランディングのないガラス容器で構成され、合成消去パターンが適用されています。これらのパターンは、実際の工場で観察される摩耗マークをエミュレートし、さまざまな形状、空間的位置、消去度を持っています。

容器の形状と装飾要素の多様性は、実世界のデータと比較して意図的に削減されていますが、検出と分類の制約は、特に順序付けられた摩耗重大度ラベルの使用により、産業条件に近いままです。

🔬 Setup d'Acquisition Multi-Vue Multi-View Acquisition Setup マルチビュー取得セットアップ

Le setup d'acquisition multi-vue est inspiré des systèmes d'inspection industriels basés sur convoyeur et est conçu pour fournir une couverture visuelle complète de la surface du conteneur. Le dataset repose sur douze caméras synchronisées disposées autour de l'axe du convoyeur, chacune capturant le même conteneur en verre depuis une direction de vue distincte.

Cette configuration permet l'observation des dégradations de surface sous différentes orientations, ce qui est essentiel compte tenu de la nature partiellement transparente et réfléchissante du verre.
The multi-view acquisition setup is inspired by industrial conveyor-based inspection systems and is designed to provide comprehensive visual coverage of the container surface. The dataset relies on twelve synchronized cameras arranged around the conveyor axis, each capturing the same glass container from a distinct viewing direction.

This configuration enables the observation of surface degradations under varying orientations, which is essential given the partially transparent and reflective nature of glass.
マルチビュー取得セットアップは、産業用コンベアベースの検査システムに触発されており、容器表面の包括的な視覚カバレッジを提供するように設計されています。データセットは、コンベア軸の周りに配置された12台の同期カメラに依存しており、それぞれが異なる視野方向から同じガラス容器をキャプチャします。

この構成により、ガラスの部分的に透明で反射性のある性質を考慮して、さまざまな方向で表面劣化を観察できます。

🎥 Configuration des Caméras 🎥 Camera Configuration 🎥 カメラ構成

Les caméras sont distribuées sur deux stations d'acquisition symétriques, chacune comprenant trois axes optiques. La deuxième station est obtenue en appliquant une symétrie horizontale à la première par rapport à l'axe du convoyeur.

Au sein de chaque station, les axes optiques sont séparés par un espacement angulaire de 50°, ce qui correspond à une configuration industrielle couramment utilisée. Dans cette configuration, les caméras sont orientées à environ 40° par rapport à l'axe du convoyeur, offrant un compromis favorable entre la couverture de surface, la visibilité des défauts et la stabilité de l'éclairage.
The cameras are distributed across two symmetric acquisition stations, each comprising three optical axes. The second station is obtained by applying a horizontal symmetry to the first with respect to the conveyor axis.

Within each station, the optical axes are separated by an angular spacing of 50°, which corresponds to a commonly used industrial configuration. In this setup, the cameras are oriented at approximately 40° relative to the conveyor axis, providing a favorable compromise between surface coverage, defect visibility, and illumination stability.
カメラは、それぞれ3つの光軸を含む2つの対称取得ステーションに分散されています。2番目のステーションは、コンベア軸に対して最初のステーションに水平対称性を適用することによって取得されます。

各ステーション内で、光軸は50°の角度間隔で分離されており、これは一般的に使用される産業構成に対応しています。このセットアップでは、カメラはコンベア軸に対して約40°に向けられており、表面カバレッジ、欠陥の可視性、照明の安定性の間で有利な妥協を提供します。

📐 Vues Frontales et Vues Élevées 📐 Frontal and Elevated Views 📐 正面ビューと高架ビュー

Pour chaque axe optique, deux points de vue de caméra sont définis : une vue frontale et une vue élevée.

Caméras à vue frontale : Positionnées le long d'un axe optique horizontal à faible angle, capturant des images aussi proches que possible du plan du convoyeur tout en garantissant que le convoyeur lui-même reste en dehors du champ de vision.

Caméras à vue élevée : Partagent la même orientation d'axe optique mais sont décalées verticalement et montées à une position plus élevée. Dans le setup proposé, les caméras à vue élevée sont placées 83 mm au-dessus des caméras à vue frontale correspondantes et sont inclinées vers le bas de -30°, correspondant à la configuration utilisée pour les petits articles.

Ce point de vue élevé et incliné permet une observation partielle en plongée du conteneur, ce qui améliore considérablement la visibilité des effacements de surface dans des régions spécifiques. La combinaison de vues frontales et de vues élevées permet de capturer des informations visuelles complémentaires.
For each optical axis, two camera viewpoints are defined: a frontal view and an elevated view.

Frontal view cameras: Positioned along a low-angle horizontal optical axis, capturing images as close as possible to the conveyor plane while ensuring that the conveyor itself remains outside the field of view.

Elevated view cameras: Share the same optical axis orientation but are vertically offset and mounted at a higher position. In the proposed setup, elevated view cameras are placed 83 mm above the corresponding frontal view cameras and are inclined downward by -30°, corresponding to the configuration used for small items.

This inclined, elevated viewpoint enables partial top-down observation of the container, which significantly improves the visibility of surface erasures in specific regions. The combination of frontal views and elevated views allows complementary visual information to be captured.
各光軸について、2つのカメラ視点が定義されています:正面ビューと高架ビュー

正面ビューカメラ:低角度の水平光軸に沿って配置され、コンベア自体が視野外に留まることを保証しながら、コンベア平面にできるだけ近い画像をキャプチャします。

高架ビューカメラ:同じ光軸の向きを共有しますが、垂直にオフセットされ、より高い位置に取り付けられています。提案されたセットアップでは、高架ビューカメラは対応する正面ビューカメラの83mm上に配置され、-30°下向きに傾斜しており、小さなアイテムに使用される構成に対応しています。

この傾斜した高架視点により、容器の部分的な俯瞰観察が可能になり、特定の領域での表面消去の可視性が大幅に向上します。正面ビューと高架ビューの組み合わせにより、補完的な視覚情報をキャプチャできます。

Note : Les vues frontales fournissent une couverture complète de la surface du conteneur mais sont affectées par la superposition de patterns due à la transparence du verre, tandis que les vues élevées réduisent les effets de superposition et améliorent la visibilité des effacements dans les régions supérieures du conteneur. Note: Frontal views provide complete coverage of the container surface but are affected by pattern superposition due to glass transparency, whereas elevated views reduce superposition effects and enhance erasure visibility in the upper regions of the container. 注:正面ビューは容器表面の完全なカバレッジを提供しますが、ガラスの透明性によるパターンの重ね合わせの影響を受けますが、高架ビューは重ね合わせ効果を減らし、容器の上部領域での消去の可視性を向上させます。

🏗️ Construction du Dataset Dataset Construction データセット構築

Le dataset a été conçu pour évaluer systématiquement la robustesse des modèles de détection d'effacement dans des conditions visuelles contrôlées mais réalistes. Sa construction repose sur la combinaison de multiples patterns visuels, points de vue de caméra, placements de conteneurs et niveaux de dégradation.

Le dataset contient 16,452 images, organisées en scènes multi-vues synchronisées. Chaque scène correspond à un seul conteneur en verre observé depuis 12 points de vue, fournissant plusieurs perspectives visuelles du même objet physique.
The dataset was designed to systematically evaluate the robustness of erasure detection models under controlled yet realistic visual conditions. Its construction relies on the combination of multiple visual patterns, camera viewpoints, container placements, and degradation levels.

The dataset contains 16,452 images, organized into synchronized multi-view scenes. Each scene corresponds to a single glass container observed from 12 viewpoints, providing multiple visual perspectives of the same physical object.
データセットは、制御されているが現実的な視覚条件下で消去検出モデルの堅牢性を体系的に評価するように設計されています。その構築は、複数の視覚パターン、カメラの視点、容器の配置、劣化レベルの組み合わせに依存しています。

データセットには16,452枚の画像が含まれており、同期されたマルチビューシーンに編成されています。各シーンは、12の視点から観察された単一のガラス容器に対応し、同じ物理オブジェクトの複数の視覚的視点を提供します。

🎨 Patterns Visuels 🎨 Visual Patterns 🎨 視覚パターン

Cinq patterns distincts ont été considérés pour générer le contenu visuel sur les parois des conteneurs. Les patterns appliqués appartiennent à cinq familles de patterns distinctes et peuvent apparaître à différentes positions sur la surface du conteneur.

Patterns 1 et 3 : Présentent des structures verticalement discontinues et ont été spécifiquement introduits pour défier la capacité du modèle à détecter les effacements verticaux, qui partagent la même orientation dominante.

Patterns 2 et 3 : Incluent des discontinuités horizontales, introduisant des variations structurelles complémentaires.

Pattern 4 : Correspond à une disposition en grille régulière, qui fournit de forts indices géométriques et facilite l'identification des effacements en offrant une référence visuelle claire.
Five distinct patterns were considered to generate the visual content on the container walls. The applied patterns belong to five distinct pattern families and can appear at different positions on the container surface.

Patterns 1 and 3: Present vertically discontinuous structures and were specifically introduced to challenge the model's ability to detect vertical erasures, which share the same dominant orientation.

Patterns 2 and 3: Include horizontal discontinuities, introducing complementary structural variations.

Pattern 4: Corresponds to a regular grid layout, which provides strong geometric cues and facilitates the identification of erasures by offering a clear visual reference.
容器の壁に視覚コンテンツを生成するために、5つの異なるパターンが考慮されました。適用されたパターンは5つの異なるパターンファミリーに属し、容器表面のさまざまな位置に表示される可能性があります。

パターン1と3:垂直に不連続な構造を示し、同じ支配的な方向を共有する垂直消去を検出するモデルの能力に挑戦するために特別に導入されました。

パターン2と3:水平方向の不連続性を含み、補完的な構造変動を導入します。

パターン4:規則的なグリッドレイアウトに対応し、強力な幾何学的手がかりを提供し、明確な視覚的参照を提供することで消去の識別を容易にします。

📐 Positions des Conteneurs 📐 Container Positions 📐 容器の位置

Les placements Bottom, Middle et Top des conteneurs ont été introduits pour exploiter ces conditions de visibilité dépendantes du point de vue. Chaque configuration de conteneur a été capturée en utilisant douze vues de caméra distinctes.

Les six premières vues correspondent à des acquisitions frontales, permettant d'observer le contour complet de la paroi du conteneur.

Les six vues restantes ont été générées à partir de positions de caméra élevées avec un angle incliné, fournissant des perspectives partielles en plongée. Ces points de vue complémentaires sont essentiels pour relever les défis induits par la transparence du verre.
The Bottom, Middle, and Top container placements were introduced to exploit these viewpoint-dependent visibility conditions. Each container configuration was captured using twelve distinct camera views.

The first six views correspond to frontal acquisitions, allowing the full contour of the container wall to be observed.

The remaining six views were generated from elevated camera positions with an inclined angle, providing partial top-down perspectives. These complementary viewpoints are essential to address the challenges induced by glass transparency.
Bottom、Middle、Topの容器配置は、これらの視点依存の可視性条件を利用するために導入されました。各容器構成は、12の異なるカメラビューを使用してキャプチャされました。

最初の6つのビューは正面取得に対応し、容器壁の完全な輪郭を観察できます。

残りの6つのビューは、傾斜角度を持つ高架カメラ位置から生成され、部分的な俯瞰視点を提供します。これらの補完的な視点は、ガラスの透明性によって引き起こされる課題に対処するために不可欠です。

🏷️ Classes et Annotations Classes and Annotations クラスとアノテーション

Le dataset est annoté en utilisant cinq classes discrètes, étiquetées de 0 à 4, selon le nombre d'effacements présents sur la paroi du conteneur. Pour chaque pattern, plusieurs niveaux de dégradation sont définis pour simuler l'usure progressive.

Il est important de noter que l'effacement partiel n'est pas nécessairement visible depuis tous les points de vue et peut être difficile à détecter dans certaines orientations en raison de la transparence, de la réfraction et des effets spéculaires. Cette caractéristique reflète fidèlement les scénarios d'inspection réels, où les défauts de surface ne peuvent être observables que sous des angles spécifiques.
The dataset is annotated using five discrete classes, labeled from 0 to 4, according to the number of erasures present on the container wall. For each pattern, multiple degradation levels are defined to simulate progressive wear.

Importantly, partial erasure is not necessarily visible from all viewpoints and may be difficult to detect in certain orientations due to transparency, refraction, and specular effects. This characteristic closely mirrors real inspection scenarios, where surface defects may only be observable from specific angles.
データセットは、容器壁に存在する消去の数に応じて、0から4までラベル付けされた5つの離散クラスを使用してアノテーションされています。各パターンについて、段階的な摩耗をシミュレートするために複数の劣化レベルが定義されています。

重要なことに、部分的な消去は必ずしもすべての視点から見えるわけではなく、透明性、屈折、鏡面効果のために特定の方向では検出が困難な場合があります。この特性は、表面欠陥が特定の角度からのみ観察可能である実際の検査シナリオを忠実に反映しています。

Classe 0

Absence d'effacement No erasure 消去なし

3,276 images (19.9%) 3,276 images (19.9%) 3,276画像 (19.9%)
Classe 1

Un effacement One erasure 1つの消去

3,300 images (20.1%) 3,300 images (20.1%) 3,300画像 (20.1%)
Classe 2

Deux ou trois effacements Two or three erasures 2または3つの消去

3,312 images (20.1%) 3,312 images (20.1%) 3,312画像 (20.1%)
Classe 3

Quatre ou cinq effacements Four or five erasures 4または5つの消去

3,264 images (19.8%) 3,264 images (19.8%) 3,264画像 (19.8%)
Classe 4

Six effacements Six erasures 6つの消去

3,300 images (20.1%) 3,300 images (20.1%) 3,300画像 (20.1%)

Note importante : Pour augmenter le niveau de difficulté et mieux refléter les scénarios industriels réels, les Classes 2 et 3 incluent intentionnellement une plage plus large de nombres d'effacements, résultant en une variabilité intra-classe. Ce choix de conception empêche des frontières de classe trop nettes et encourage le modèle à apprendre des critères de décision plus robustes. Important note: To increase the level of difficulty and better reflect real industrial scenarios, Classes 2 and 3 intentionally include a wider range of erasure counts, resulting in intra-class variability. This design choice prevents overly sharp class boundaries and encourages the model to learn more robust decision criteria. 重要な注意:難易度を上げ、実際の産業シナリオをよりよく反映するために、クラス2と3は意図的により広い範囲の消去数を含み、クラス内変動性をもたらします。この設計選択は、過度に鋭いクラス境界を防ぎ、モデルがより堅牢な決定基準を学習することを奨励します。

🏷️ Processus d'Étiquetage 🏷️ Labeling Process 🏷️ ラベリングプロセス

Le processus d'étiquetage implique deux aspects complémentaires : l'attribution de classe et l'annotation de bounding box. The labeling process involves two complementary aspects: class assignment and bounding box annotation. ラベリングプロセスには、クラス割り当てとバウンディングボックスアノテーションの2つの補完的な側面が含まれます。

Attribution de classe : Les informations de classe ont été générées et stockées simultanément avec l'acquisition d'images, garantissant que chaque image était associée à une étiquette de classe avant l'étape d'annotation. Par conséquent, l'étiquetage de classe ne repose pas sur une intervention manuelle a posteriori et reste cohérent sur l'ensemble du dataset. Class assignment: Class information was generated and stored simultaneously with image acquisition, ensuring that each image was associated with a class label prior to the annotation stage. As a result, class labeling does not rely on post hoc manual intervention and remains consistent across the entire dataset. クラス割り当て:クラス情報は画像取得と同時に生成および保存され、各画像がアノテーション段階の前にクラスラベルに関連付けられることを保証しました。その結果、クラスラベリングは事後の手動介入に依存せず、データセット全体で一貫性を保ちます。

Annotation de bounding box : Une stratégie d'étiquetage semi-automatique a été adoptée. Initialement, 450 images ont été annotées manuellement avec des bounding boxes, avec un soin particulier pour assurer une grande diversité en termes de classes, positions de conteneurs, patterns visuels et points de vue de caméra. Bounding box annotation: A semi-automatic labeling strategy was adopted. Initially, 450 images were manually annotated with bounding boxes, with particular care taken to ensure a high level of diversity in terms of classes, container positions, visual patterns, and camera viewpoints. バウンディングボックスアノテーション:半自動ラベリング戦略が採用されました。最初に、450枚の画像がバウンディングボックスで手動でアノテーションされ、クラス、容器の位置、視覚パターン、カメラの視点の観点から高レベルの多様性を確保するために特別な注意が払われました。

L'ensemble annoté a ensuite été utilisé pour entraîner un modèle YOLOv8 chargé exclusivement d'apprendre à localiser avec précision les effacements via la prédiction de bounding box. Une fois entraîné, le modèle a été utilisé pour inférer des bounding boxes sur l'ensemble du dataset. Ce processus itératif d'inférence, de révision et de réentraînement a été répété jusqu'à ce qu'aucune erreur d'annotation significative ne soit observée. The curated set was then used to train a YOLOv8 model tasked exclusively with learning to accurately localize erasures via bounding box prediction. Once trained, the model was used to infer bounding boxes across the entire dataset. This iterative process of inference, review, and retraining was repeated until no significant annotation errors were observed. キュレーションされたセットは、バウンディングボックス予測を介して消去を正確にローカライズすることを学習することのみを任務とするYOLOv8モデルのトレーニングに使用されました。トレーニング後、モデルはデータセット全体でバウンディングボックスを推論するために使用されました。この推論、レビュー、再トレーニングの反復プロセスは、重大なアノテーションエラーが観察されなくなるまで繰り返されました。

📊 Statistiques du Dataset Dataset Statistics データセット統計

16,452
Images Totales Total Images 総画像数
1,371
Scènes Multi-Vues Multi-View Scenes マルチビューシーン
5
Classes Classes クラス

📈 Distribution des Données 📈 Data Distribution 📈 データ分布

Distribution par Pattern Distribution by Pattern パターン別分布

Distribution par Pattern
Pattern 1
3,300 images (20.1%)
Pattern 2
3,300 images (20.1%)
Pattern 3
3,360 images (20.4%)
Pattern 4
3,252 images (19.8%)
Pattern 5
3,240 images (19.7%)

Distribution par Position Distribution by Position 位置別分布

Distribution par Position
Bottom (B)
5,340 images (32.5%)
Middle (M)
5,352 images (32.5%)
Top (T)
5,760 images (35.0%)

Distribution par Classe Distribution by Class クラス別分布

Distribution par Classe
Classe 0
3,276 images (19.9%)
Classe 1
3,300 images (20.1%)
Classe 2
3,312 images (20.1%)
Classe 3
3,264 images (19.8%)
Classe 4
3,300 images (20.1%)

📝 Citation Citation 引用

Si vous utilisez ce dataset dans vos travaux de recherche, veuillez citer la publication suivante : If you use this dataset in your research work, please cite the following publication: 研究活動でこのデータセットを使用する場合は、次の出版物を引用してください:

@misc{bernardi2026compact,
  title={Compact Mamba Multi-View for Object Detection},
  author={Bernardi, Gwendal and Brisebarre, Godefroy and Roman, Sebastien and Ardabilian, Mohsen and Dellandrea, Emmanuel},
  year={2026},
  note={hal-05494004}
}

⚖️ Licence License ライセンス

Ce dataset est mis à disposition sous licence Creative Commons Attribution 4.0 International (CC BY 4.0). Vous êtes libre de partager et adapter le dataset pour tout usage, y compris commercial, à condition de créditer les auteurs. This dataset is made available under the Creative Commons Attribution 4.0 International (CC BY 4.0) license. You are free to share and adapt the dataset for any purpose, including commercial use, provided you credit the authors. このデータセットはCreative Commons Attribution 4.0 International (CC BY 4.0)ライセンスの下で提供されています。 著者をクレジットすれば、商用利用を含むあらゆる目的でデータセットを共有および改変することができます。