Football professionnel : comment la Data Science révolutionne la prévention des blessures

Par Haitam BENKADDOUR, Tommy-Lee BERNARD, Quentin BLANCHET, Loan VILLEMIN, Myriam YEROU, élèves ingénieurs du parcours Data Science à IMT Atlantique.

Une problématique cruciale dans le football moderne

Aujourd’hui le football fait face à une crise liée à un calendrier de matchs de plus en plus dense et aux blessures qui en découlent. La FIFPRO, le syndicat mondial des joueurs, tire la sonnette d’alarme : lors de la saison 2020-2021, 72% des footballeurs professionnels dans le monde ont dépassé le seuil critique de 55 rencontres par saison, un niveau qui met en danger leur intégrité physique.

Cette problématique est d’autant plus critique que les calendriers continuent de se densifier, augmentant les risques de blessures et impactant directement la performance des équipes.

Quelques chiffres-clés illustrant l’ampleur du problème

Plus de 7 joueurs sur 10 ont dépassé le seuil critique de matchs par saison.

Le coût moyen des blessures pour un club de Premier League est de 45 millions de livres par saison.

Augmentation de 20% des blessures musculaires entre 2016 et 2023 dans les 5 grands championnats européens.

82% des joueurs pensent que le calendrier actuel a un impact négatif sur leur santé physique et mentale.

Sources : FIFPRO Player Workload Report, UEFA Elite Club Injury Study, Premier Injuries Annual Report.

La solution : l’analyse de données au service de la récupération physique

Notre approche se fonde sur l’analyse de données pour aider les préparateurs physiques à aménager les entraînements et les temps de récupération des joueurs, afin de prévenir les blessures. Nous avons exploité trois jeux de données complémentaires:

Performances en match : nombre de minutes jouées, nombre de matchs disputés, statistiques individuelles (sprints, dribbles, buts, etc.).
Blessures : dates de début et de fin des blessures, leur nature et nombre de matchs manqués.
Caractéristiques des joueurs : taille, poids, date de naissance, poste.

Ces données, regroupant 5097 joueurs sur 4 saisons des 5 grands championnats européens, nous ont permis d’identifier les facteurs de risques et de développer des modèles prédictifs. Nous avons constaté un volume élevé de blessures mensuelles, avec environ 4000 blessures recensées sur notre échantillon (cf. Fig. 1).

Fig. 1 : Graphique du nombre de blessures par mois

Grâce à notre analyse exploratoire des données, nous avons constaté un déséquilibre entre nos classes.

Transformer les données brutes pour prévenir les blessures

L’objectif de notre projet est d’identifier les facteurs clés liés aux blessures et de développer un modèle prédictif capable d’anticiper les risques de blessure dans les 30 prochains jours. Pour cela, nous avons créé de nouvelles variables:

Temps écoulé depuis la dernière blessure
Nombre de matchs joués sur différentes périodes (7, 30, 90, 365 jours)
Nombre de matchs consécutifs
Nombre de blessures par type
Intensité des matchs
Âge et IMC du joueur

Traitement des données : les valeurs extrêmes et les valeurs manquantes ont été gérées pour optimiser l’identification des patterns.

Suppression de données : les jeunes joueurs avec peu de minutes jouées, sans historique de blessures, ont été retirés des datasets.

Gestion des joueurs sans blessures : pour les joueurs sans blessures mais avec suffisamment d’informations, la variable « Temps écoulé depuis la dernière blessure » a été attribuée avec un temps maximum.

L’approche : des modèles de classification pour anticiper les risques

Dans le monde du sport professionnel, chaque blessure peut avoir des conséquences majeures : absence prolongée des joueurs, impact sur les performances de l’équipe, et coûts élevés pour les clubs. Mais imaginez si l’on pouvait prédire ces risques avant qu’ils ne se produisent ?

C’est précisément l’objectif de notre démarche : utiliser des modèles d’intelligence artificielle pour analyser les données des joueurs et anticiper leurs risques de blessures.

Nous avons testé plusieurs algorithmes de classification supervisée:

Régression logistique
Classificateur Naive Bayes
Random Forests
XGBoost
SVM

Résultats et choix du modèle : XGBoost, le champion de la prédiction des blessures.

Après une évaluation rigoureuse, le modèle XGBoost optimisé avec Grid Search s’est avéré le plus performant, avec une accuracy de 70% et une surface sous la courbe AUC-ROC de 0.78 (cf. Fig. 2). Il est de plus bien adapté aux classes déséquilibrées.

Fig. 2 : Courbe ROC pour XGBoost avec GridSearch

Ce modèle offre la meilleure capacité de détection des joueurs à risque de blessure. De plus, les joueurs en bonne santé ne sont pas faussement classés comme blessés.

Impacts et recommandations : protéger les joueurs, améliorer la performance

Notre modèle permet d’anticiper les risques de blessure, offrant ainsi aux préparateurs physiques un outil précieux pour optimiser la gestion des joueurs. Voici quelques recommandations clés fondées sur nos analyses:

Limiter la charge cumulée de jeu (par exemple, 200 minutes sur 7 jours)
Garantir un repos minimum de 48 heures entre 2 matchs intenses
Planifier les rotations en fonction des charges cumulées et des prévisions de risques

Ainsi, l’utilisation de notre modèle XGBoost permet un gain de 5% dans la détection des blessures, sans pour autant augmenter le nombre de faux positifs, ce qui préserve l’effectif disponible pour l’entraîneur.

Perspectives d’amélioration : vers une prédiction encore plus fine

Bien que notre modèle soit performant, des améliorations sont possibles. Il serait intéressant d’intégrer davantage de données, comme :

Les conditions météorologiques, le type de terrain
Le niveau de stress des joueurs, leur nutrition, les antécédents de blessures
Les données d’entraînement et de récupération
Le style de jeu des équipes adverses

Nous envisageons également d’implémenter des modèles plus adaptés au déséquilibre des classes, comme les réseaux de neurones. Le développement d’une interface visuelle pour faciliter l’interprétation des risques est aussi une priorité.

Conclusion : un avenir plus sûr et plus performant pour le football

Notre projet démontre comment la data science peut révolutionner le football professionnel en permettant une meilleure anticipation des blessures et une optimisation de la gestion des joueurs. L’algorithme XGBoost développé s’est avéré être un outil précieux pour prédire les risques de blessures avec une amélioration de 5% par rapport aux méthodes existantes.

En intégrant davantage de données et en collaborant étroitement avec les acteurs du football, nous pouvons bâtir un avenir où les joueurs seront mieux protégés et les équipes plus performantes.

Références

La pluie ne rentre pas dans le métro

Par Wydie Nessesy Kela, Christ Dadie, Thibault Martinez, Baka-Junior Cedric Blé, Louis Laudereau

Les transports en commun sont aujourd’hui parmi les principaux moyens de transports quotidiens en France. Aujourd’hui, 22% de la population française utilise les transports en commun dans leurs trajets quotidiens [1].

Comment pouvons nous rendre plus agréable ces trajets quotidiens et améliorer la vie de plus d’1/5 des français ?

Un besoin de visibilité sur le réseau

En interrogeant les utilisateurs des réseaux de transports en communs en France [2], il apparaît que ceux-ci aimerait en priorité des transports plus fréquents (Fig.1).

Fig. 1 Les avantages des transports publics selon les Français en 2022 [2].

Cependant, il est préférable pour les gestionnaires de réseaux d’allouer plus de transports lorsqu’ils en ont vraiment besoin, comme lors de fortes variations de fréquentation. Au-delà des variations dues à l’heure ou au jour, la météo pourrait être un facteur influençant la fréquentation des transports en commun. On s’imagine facilement que lors d’un jour pluvieux par exemple, des personnes se rendant normalement au travail à pied préfèrent le bus ou le métro. Rennes étant une ville assez pluvieuse et dont les données du réseau régi par l’entreprise STAR sont accessibles librement, ce sera sur cette ville que nous explorerons cette idée.

Nous cherchons donc à fournir à l’entreprise STAR à Rennes des prédictions de variation de fréquentation en prenant en compte les données météos pour que celle-ci adapte le nombre de transport en conséquence.

Des variations de fréquentation saisonnières

Pour répondre à notre problème, il nous faut donc tout d’abord des données sur la fréquentation des lignes du réseau STAR. Nous nous procurons sur le site de STAR une base de données de fréquentation relevée toutes les 15 min [3]. Il nous faut en effet des relevés assez fréquents pour prédire la fréquentation à des heures précises et pouvoir adapter le nombre de transports en conséquence plus précisément.

En analysant ces données, on voit apparaître des tendances saisonnières sur la fréquentation du réseau. On remarque notamment des différences en fonction de la saison (Fig.2) ou de l’heure (Fig.3). On observe aussi évidemment une baisse de fréquentation le week-end et les jours de vacances scolaires.

Fig. 2 : Moyenne de fréquentation par saison

Fig. 3 Fréquentation moyenne sur une journée

Pour savoir sur quelle ligne de transport il serait le plus nécessaire de moduler le nombre de transports en fonction de la fréquentation, on affiche les variations de fréquentation maximales par ligne (Fig.4) calculées par rapport à des fréquentations moyennes sur les différentes périodes. On voit bien que les variations les plus importantes du nombre de passagers se situent sur le métro a. Ajoutez à ça que cette ligne est automatique, celle-ci apparaît comme la candidate parfaite pour notre étude. On ne s’intéresse donc maintenant qu’à cette ligne dans la prédiction de la variation de fréquentation en fonction de la météo. Mais pour cela, il nous faut des relevés de météo.

Fig. 4 : Variation maximale de fréquentation par ligne

Une multitude de données météo

Nous trouvons un dataset Météo France [4] qui nous fournit des relevés horaires d’une station proche de Rennes. Ces mesures vont de la température à l’humidité en passant par la puissance du vent.

On s’assure rapidement que nos données sont cohérentes et que l’on utilise pas un jeu de données complètement faux avant de relier ces données météo à nos données de fréquentations.

Qu’en est-il du lien entre fréquentation et météo ?

Pour analyser le lien entre la météo et la fréquentation, on regroupe nos deux jeux de données en un plus grand dans lequel on associe pour chaque heure de chaque jour les relevés météo et la fréquentation associés.

On calcule alors des coefficients de corrélation entre la fréquentation et les données météos. Nous ne trouvons aucune variable météo qui expliquerait seule les variations de fréquentation, mais certaines valeurs de corrélations non négligeables nous laissent présager que l’association de toutes les données météos pourrait nous permettre de prédire efficacement ces variations.

Cependant, aucun lien n’apparaît entre nos données météo et la variation de fréquentation. Ainsi, nous décidons de prédire premièrement la fréquentation grâce aux données météos, puis nous calculons la variation de fréquentation en comparant la valeur de fréquentation et la valeur moyenne de fréquentation associée.

Comment prédire ces fréquentations ?

Nous essayons de prédire une variable cible : la fréquentation. Pour cela nous utiliserons donc un algorithme d’apprentissage supervisé qui prendra la forme d’un modèle de régression.

Un algorithme d’apprentissage supervisé s’entraîne, sur des données collectées, à prédire la variable cible à partir d’autres variables, dans notre cas les relevés météos. Il ajuste son fonctionnement au cours de l’apprentissage pour améliorer ses prédictions. Il peut lui-même savoir s’il se trompe ou non car il peut comparer sa prédiction avec la réponse attendue qui est comprise dans le jeu de données.

Un modèle de régression est simplement un algorithme qui prédit une valeur numérique (qui peut prendre n’importe quelle valeur). C’est l’opposé d’un modèle de classification qui prédit une valeur parmi un ensemble de plusieurs valeurs définies (chaque valeur étant associée à une classe)

Il existe une multitude d’algorithmes d’apprentissage supervisé utilisables pour faire de la régression. Nous devons donc tous les tester pour choisir le meilleur qui sera choisi comme algorithme final.

Est-ce que ces modèles sont performants ?

On compare premièrement la performance des différents modèles de prédiction sur une petite partie des nos données, appelée échantillon de validation. Le modèle le plus performant est le Gradient Boosting. Nous le choisissons donc comme notre algorithme final. Cet algorithme a un fonctionnement assez simple : il corrige petit à petit son erreur de prédiction par rapport à la valeur qu’il aurait dû trouver. Il estime à chaque itération cette erreur et la retire au résultat final, d’où son utilité dans notre cas d’une valeur continue.

Nous entraînons notre modèle final avec le reste de nos données, tout en gardant une petite partie de nos données restantes comme échantillon de test. Ce dernier nous permet alors d’obtenir la performance de notre modèle final sur des données qu’il n’a jamais rencontrées et à savoir si celui-ci pourra être utile à l’entreprise STAR.

Un des scores nous permettant d’évaluer la performance de notre modèle est la MAE ou Mean Absolute Error. Cette valeur est simplement l’erreur moyenne de notre modèle. Nous trouvons une valeur de 668. Ainsi, notre modèle se trompe en moyenne de 668 personnes quand il prédit la fréquentation sur la ligne a. Cette valeur peut paraître énorme, mais elle est un peu plus acceptable quand on la compare avec la fréquentation moyenne qui est autour de 10 000. Mais, notre modèle n’a au final pas l’air d’être assez performant pour imaginer qu’il serait utile à l’entreprise STAR.

Un modèle non déployable en l’état

En creusant un peu plus, on se rend compte que ces erreurs ne sont pas du tout négligeables à côté des valeurs de variations de fréquentation. Dans ces conditions, il n’est pas envisageable que ces prédictions soient utilisées pour modifier le nombre de rames lorsque ces mêmes prédictions se trompent en moyenne d’autant que la variation de fréquentation pour la période donnée. L’entreprise STAR serait alors amenée à ajouter des rames en prévision d’une variation qui n’existe pas, ou au contraire de ne pas rajouter de rames là où le modèle n’a pas réussi à anticiper une variation de fréquentation.

Nous pouvons envisager d’améliorer notre modèle pour prédire plus précisément les variations de fréquentations en cherchant des facteurs supplémentaires pouvant influencer la fréquentation du métro a, ou encore améliorer l’approximation des moyennes de fréquentation par période (et donc des variations de fréquentation) par une analyse des tendances saisonnières plus poussée.

Sources

[1] Moyens de transport utilisés par les Français pour les déplacements quotidiens 2024 – Statista Research Department

[2] Union des Transports Publics et Ferroviaires (UTP). (2022). Observatoire de la mobilité 2022 (p. 12). UTP. https://www.utpf-mobilites.fr/system/files/2022-11/20220927_dp_observatoire_de_la_mobilite_v2.0.pdf

[3] https://data.explore.star.fr/explore/dataset/tco-billettique-frequentation-detaillee-td/table/

[4] https://www.data.gouv.fr/fr/organizations/meteo-france/#/datasets

Quand l’Éducation Influence la Sécurité : Décryptage de l’impact de la construction des Écoles sur la Criminalité à Chicago

Par : @Soumaya RAZZOUK, @Chenjie QIAN, @Hicham CHEKIRI et @Yann Legendre

Avec un taux de criminalité de 33 pour mille habitants et plus de 8 millions de crimes enregistrés depuis 2001, Chicago figure parmi les villes les plus touchées par la criminalité en Amérique.

Quels facteurs influencent la criminalité dans cette métropole ?

Inspiré par des recherches analysant la relation entre l’éducation et la criminalité notre projet explore l’influence des écoles sur la sécurité urbaine.

Répartition géographique des écoles et des incidents criminels à Chicago – Source des données : Chicago Data Portal

Des études au préalables ont montré que les caractéristiques des écoles, telles que les activités parascolaires, la nature de l’école et les heures de cours, peuvent avoir un impact significatif sur la délinquance et la criminalité indépendamment du contexte social et démographique.

Notre objectif est de développer un modèle de Machine Learning prédictif qui évalue l’impact potentiel de la construction des nouvelles écoles sur le taux de criminalité sur une période de sept ans, offrant ainsi des perspectives innovantes afin d’explorer comment l’éducation peut influencer la sécurité urbaine à Chicago.

Données utilisées

Répartition géographique des écoles et le rayon d’impact des incidents criminels à Chicago – Source des données : Chicago Data Portal

Notre étude s’appuie sur des données publiques issues du Chicago Data Portal, qui est géré par la municipalité de la ville. Nous avons analysé sept jeux de données relatifs aux établissements scolaires de 2016 à aujourd’hui, ainsi qu’un jeu de données sur les crimes enregistrés de 2001.

L’objectif est d’évaluer l’impact des écoles sur le taux de criminalité dans un rayon de 1 km autour de celles-ci, sur une période allant jusqu’à sept ans.

Pour cela, nous avons créé des jeux de données croisés permettant d’analyser l’évolution annuelle de la criminalité par rapport à l’année de référence 2016 :

Dataset 1 : écoles 2016 ↔ crimes 2017
Dataset 2 : écoles 2016 ↔ crimes 2018
Dataset 3 : écoles 2016 ↔ crimes 2019
Dataset 4 : écoles 2016 ↔ crimes 2020
Dataset 5 : écoles 2016 ↔ crimes 2021
Dataset 6 : écoles 2016 ↔ crimes 2022
Dataset 7 : écoles 2016 ↔ crimes 2023

Regardons les données de plus près : Analyse des corrélations

Matrice de corrélation des variables du jeu de données fusionné

Pour résumer les corrélations des données analysées, nous pouvons dire que les corrélations entre les variables étudiées et le taux de criminalité sont relativement faibles.

Cela confirme l’hypothèse selon laquelle le taux de criminalité est influencé par une multitude de facteurs autres que les seules politiques internes des écoles.

Toutefois, il semble exister une association plus marquée entre la présence d’écoles dans un quartier, le nombre d’étudiants, et le taux de criminalité plutôt qu’avec les caractéristiques propres à chaque établissement scolaire.

Construction du modèle

Algorithmes utilisés

Nous avons utilisé plusieurs modèles, y compris le Random Forest, SVM et des variantes de Boosting, pour identifier ceux qui prévoient le mieux les taux de criminalité future.

Les modèles les plus performants, jugés sur la base de leur erreur moyenne absolue (MAE) et de l’erreur quadratique moyenne (RMSE), ont été combinés pour créer un modèle composite robuste.

Ce modèle est adapté pour prédire l’évolution de la criminalité sur une période allant jusqu’à sept ans.

Validation

Pour garantir la fiabilité de nos modèles prédictifs, nous avons mis en place une validation croisée sur les modèles, chacun comprenant environ 655 lignes.

Cette technique permet de s’assurer que nos algorithmes généralisent bien au-delà des données d’entraînement et ne mémorisent pas simplement les données (overfitting).

Les résultats de cette validation croisée ont confirmé l’efficacité de nos modèles, avec une diminution des erreurs.

L’analyse de l’importance des variables, issue de nos modèles et tenant compte des corrélations limitées, révèle que la :

le taux de criminalité est davantage lié à la proximité des établissements scolaires qu’à leurs politiques internes comme les codes vestimentaires ou les programmes parascolaires.
Cette divergence par rapport aux articles identifiés souligne l’importance de prendre en compte le contexte local de chaque zone, avec les différents indicateurs démographiques.

Résultats ? Notre modèle offre une double fonctionnalité

Prédit l’évolution du taux de criminalité sur sept ans en se basant sur les données actuelles des écoles. Ainsi, il est capable de projeter l’incidence criminelle de 2024 à 2030 en utilisant les informations de 2023.

2. Simule l’effet de l’ajout d’une nouvelle école dans une zone spécifique (Latitude et longitude) et évalue l’impact sur la criminalité dans un rayon de 1 KM de l’école et les écoles à côté (en se concentrant sur les intersections des cercles).

Le modèle nous permet aussi de faire une comparaison de la situation des crimes avec et sans l’introduction d’une école avec des critères spécifique dans une zone donnée .

Nos simulations révèlent que l’extension des programmes parascolaires peut diminuer l’impact sur le taux de criminalité environnant.

Conclusion

Les résultats obtenus à travers notre modèle fournissent une base solide pour les décideurs locaux de Chicago afin de prendre des décisions en ce qui concerne la construction d’écoles dans des zones spécifiques.

Notre analyse a révélé aussi que l’impact des écoles sur la criminalité locale est complexe et ne repose pas uniquement sur les programmes éducatifs, soulignant l’importance d’intégrer d’autres facteurs lors de la planification de nouvelles infrastructures éducatives (postes de polices, état du quartier …) et de prendre en considération les indicateurs démographiques, la situation financière des étudiants recrutés par chaque école pour plus d’alignement avec les articles sur lesquels nous avons basés nos hypothèses..

Les insights fournis par notre étude offrent des pistes prometteuses pour des stratégies urbaines plus éclairées. Pour aller de l’avant, il serait judicieux d’envisager une approche collaborative impliquant éducateurs, autorités locales, et communautés pour bâtir un environnement plus sûr. Finalement, cette recherche ouvre la voie à des études supplémentaires qui pourraient explorer des interventions ciblées et personnalisées, contribuant ainsi à la transformation positive de Chicago.

Références

Crews, G. (2009). Education and crime. In J. M. Miller 21st Century criminology: A reference handbook (pp. 59-66). SAGE Publications, Inc., https://www.doi.org/10.4135/9781412971997.n8
Gottfredson et al., (2004). « Do After School Programs Reduce Delinquency? »
Willits, Broidy, et Denman, « Schools, Neighborhood Risk Factors, and Crime ».

Can Data Science unlock the secrets of Global Warming’s impact on Agriculture?

By Breno HASPARYK ANDRADE, Ferdy LARROTTA RUIZ , Tran Phuong Uyen NGUYEN , Nour ABBOUD

As we travel through the Earth, we can notice the symphony we hear all around, from the smallest grain of sand, to the faraway planets, to a flower putting roots in the ground, every bird in the sky, every rock, and every raindrop as it falls from the clouds, every ant, every plant, every breeze, and all the seas contribute to this beautiful composition. However, within this natural orchestra, there’s a dangerous problem that demands our attention — ‘Global Warming’.

With the variation of the temperature over recent decades, the agriculture is considered as one of the most affected sectors by global warming. These environmental changes have disrupted the agricultural landscape, affecting both its ecology and economy.

Describing the impact of global warming on agriculture is a bit like exploring a big, diverse world map. Each country in this map has its own distinct climate, crops, and economic structures. This diversity is what makes our world interesting but also makes problem-solving a bit challenging.

This is where the idea of assessing vulnerability for countries takes center stage. Consider Vulnerability as a measure of how susceptible a country is to the challenges posed by global warming in the sector of agriculture.

Some countries may be more resilient, while others may face high risks due to their specific circumstances which make them vulnerable countries. Our challenge: predict the vulnerability of the countries by 2030.

Given the crucial role of non-governmental organizations (NGOs) to address the effects of global warming on agriculture, our primary focus goes beyond identifying the most vulnerable countries, we aim to predict this vulnerability by the year 2030 and foresee the difficulties before they happen. In that way, we can empower NGOs with pivotal information that may serves as initiatives for them to take action and tailor solutions and strategies before the things get too hard for vulnerable countries.

A data-driven definition of Vulnerability

To achieve this ambitious goal, we delved into the world of data. This exploration involves carefully choosing our data from a reliable, open- data source: ‘Food and Agriculture Organization of the United Nations’. We focus on Geography and Economics data, Environment Temperature Changes Data and Agriculture (Crop Yield) Data.

Geography and Economics data¹: it underscores information related to percentage of the country area cultivated, Gross Domestic product (GDP), agriculture’s GDP contribution, total renewable water resources, and the national rainfall Index.
Environment Temperature Change Data²: it focuses on temperature change factor for different countries.
Agriculture (Crop Yields) Data³: it involves the production values for specific crop yields. All our datasets are meticulously organized, categorized by country and year.

Inspired by cutting-edge research⁴⁵, we’ve strategically organized our variables into three main components. Each component serves as a building block for our mission to assess vulnerability in the face of global warming’s impact on agriculture. Let’s delve into these components:

Exposure: How much the country is exposed to different climatic factors.

Sensitivity: How sensitive the agriculture in the area is to certain risks.

Adaptive Capacity: How well the area can adapt to and cope with the challenges posed by global warming.

We then attribute each variable to one of those three components as well as adding new variables to enhance our understanding.

Data Preparation

We started by preparing our datasets and transform them into refined insights in order to make them ready for future work.

Rename the countries and matching them: We begin by renaming and identifying matching countries across all datasets. This is a foundational step when merging all the datasets together.

Handling Missing Data: We address missing data using advanced techniques. The power of KNN imputation or zero imputation comes into play, ensuring our datasets are robust and comprehensive.

Creating New Variables: we succeeded to create new variables as outlined in the data organizing phase. This step play an important role in shaping our analysis.

Data Integration: Merging datasets together seamlessly, we ensure a unified view that enhances the effectiveness of our analysis.

Data Normalization: Recognizing the diverse nature of our variables, we implement normalization techniques for both positive and negative variables. Positive variable indicates a positive relation with vulnerability, while negative variable signify a negative relation. This step ensures fair treatment of climate and agriculture variables for accurate vulnerability assessment.

Assessing Global Vulnerability: How does it Work?

Since our goal is to identify the vulnerable countries in the face of global warming’s impact on the agriculture by 2030, we embark in another journey that requires a deep comprehensive of methodologies for calculating vulnerability, making predictions and providing insightful vulnerability classifications.

Our proposal: a Vulnerability index

The key concept of assessing vulnerability of the countries was to create a new variable called ‘Vulnerability index’(VI). This calculation of this variable is based on two main approach that are taken from two innovative research.

Component -based Approach⁶:

As we organized our variables into three main components— Exposure(S), Sensitivity(S) and Adaptive Capacity (AC), we were seeking to calculate the vulnerability index by identifying the vulnerability of each component separately and than summing them up as illustrated in the figure. To achieve this, we assign weights to each variable attributed to one of these components. The weights represent the relative importance of each variable in the vulnerability index calculation.

We used two methods for assigning the weights: Equal weights method, where each variable is considered equally important and the Principle component Analysis (PCA) method, which involves mathematical techniques to capture the most critical information presenting in our data in a smaller set of components, then assigning weights based on the variables’ contribution to the first principal component. This dual-weighting strategy results in two different vulnerability indices: Equal -weights Vulnerability and Principle Component Analysis (PCA)- weights Vulnerability.

Entropy- Based Approach⁷:

In contrast of the component-based approach, entropy-based approach simplifies the calculation of the Vulnerability Index by considering all the variables together. Measuring uncertainty and information content. The idea is to measure the uncertainty or information associated with each variable. This unique perspective on vulnerability, has a pivotal role in emphasizing variables that offer more certain and informative signals. We ended up after this approach, having Entropy-weights Vulnerability Index.

Making predictions

Having The three main Vulnrability indexes: Equal -weights Vulnerability and Principle Component Analysis (PCA)- weights Vulnerability and Entropy-weights Vulenrability, and recognizing the unique trajectories each country has followed, we decided to delve into the next phase: Prediction. In this step, we aim to predict our three vulnerability indices until the year 2030 by looking into the patterns and trends for each country. To achieve this, we used the ARIMA model, known as its suitability in short term-forecasting and capability in capturing temporal patterns⁸.

ARIMA model performance: negligible error values for all 3 indices

In order to evaluate the performance of the ARIMA model in making predictions for each of our vulnerability indices, we used the MEAN SQUARED ERROR (MSE) and MEAN ABSOLUTE ERROR (MAE) for evaluating our results. Thus, after exploring the results from the MSE measure from the figure below, we notice that the Entropy and PCA methods for calculating the vulnerability have a better performance than Equal Weights method. However, we can see that for all of those methods, we can consider that the error values are practically negligible.

Providing Vulnerability Classification

In this step, we looked forward to classify the countries based on the predictions’ values of each of their vulnerability indices. This involves categorizing countries based on their index values using the Percentile method. Countries below the 25^th percentile of their vulnerability index is considered as Relatively non-vulnerable, those above the 75^th percentile are considered as Relatively vulnerable , and the rest fall into Neutral Category. This classification provide us with a list of vulnerable countries for both 2020 and 2030 across all indices.

The figures above represent the vulnerable countries we got after extracting the common vulnerable countries from the classifications results of the three vulnerability indices. The countries in brown are the countries that remain vulnerable from 2020 to 2030, the red countries are the new countries that turn into vulnerable in 2030 and the green one is the country that improves its status from vulnerable to neutral by the year of 2030.

To see how the vulnerability index and the countries’ ranking have changed over years, we made an animated bar chart race to illustrate it. You can click here.

Turning Data into Action

As we navigate the impacts of global warming on agriculture, our journey has revealed insights into vulnerability across nations. We got a list of 24 vulnerable countries in 2020 and a list of 27 vulnerable countries in 2030 in which there are some countries that are going to be vulnerable in 2030 such as India, Nigeria, Tanzania and one country that will improve its status by the year of 2030: Brunei. With this information, we propose some strategies to the NGOs to take specific actions to support those countries indeed.

For those countries that remain vulnerable until 2030, NGOs can take some actions to improve their status by developing and implementing sustainable agriculture practices. This includes promoting efficient water management, soil conservation, and the adoption of climate-resilient crop varieties.

Countries that are going to be vulnerable by the year of 2030 need preemptive strategies. NGOs can collaborate to establish early-warning systems, support climate-smart agricultural practices, and facilitate knowledge exchange between nations that have successfully mitigated vulnerabilities. Moreover, NGOs can work on some factors in the Adaptive Capacity Components to avoid vulnerability like expanding cultivated areas, supporting population control measures, and boosting total production through research and innovation.

While our findings provide a valuable insights, acknowledging limitations is key. Expanding datasets, incorporating subjective insights, and focusing on specific crop vulnerabilities are our directions for future exploration. So let’s turn these improvements into actionable steps for a resilient and sustainable agricultural future.

FAO AQUASTAT Dissemination System ↩︎
FAOSTAT Temperature change on land ↩︎
OURWORLDINDATA Crop Yields ↩︎
Duong Thi Loi, Le Van Huong, Pham Anh Tuan, Nguyen Thi Hong Nhung, Tong Thi Quynh Huong, Bui Thi Hoa Man, An Assessment of Agricultural Vulnerability in the Context of Global Climate Change: A Case Study in Ha Tinh Province, Vietnam, 2022 ↩︎
Lotten Wirehn, Åsa Danielsson, Tina-Simone S. Neset, Assessment of composite index methods for agricultural vulnerability to climate change, Journal of Environmental Management 156 (2015) 70-80, 2015. ↩︎
Lotten Wirehn, Åsa Danielsson, Tina-Simone S. Neset, Assessment of composite index methods for agricultural vulnerability to climate change, Journal of Environmental Management 156 (2015) 70-80, 2015. ↩︎
Leifang Li, Renyu Cao, Kecheng Wei, Wenzhuo Wang, Lei Chen, Adapting climate change challenge: A new vulnerability assessment framework from the global perspective, Journal of Cleaner Production, 2019. ↩︎
https://machinelearningmastery.com/arima-for-time-series-forecasting-with-python ↩︎

Réduire la criminalité à New York avec la planification urbaine, c’est possible ?

Par Antoine PERRIN-DELORT, Daniel TERAN FERNANDEZ, Emmanuela TERTULIANO MOREIRA DE SOUSA, Julien BONTEMPS élèves ingénieurs du parcours Data Science à IMT Atlantique.

Le point de départ de notre enquête

Avec une population dépassant les 8 millions d’habitants, New York City se positionne parmi les villes les plus influentes en Amérique du Nord. Ville dynamique et en perpétuelle mutation, des réglementations ont été instaurées, restreignant le port d’armes à feu dans certaines zones. Néanmoins, ces mesures suscitent des débats au sein de la sphère politique de New York.

Cependant, malgré les restrictions, le nombre élevé de fusillades persiste au sein de la ville, avec plusieurs centaines d’incidents recensés au cours des dernières années. De plus, la constante évolution de la ville rend la planification urbaine de plus en plus complexe au fil du temps. Face à cette réalité, la problématique qui se pose est la suivante :

Peut-on améliorer la sécurité urbaine de New York City grâce à des initiatives d’urbanisation ?

Notre exploration de la littérature scientifique a rapidement corroboré l’existence de liens significatifs entre les crimes et les localisations, l’agencement et les types de bâtiments publics dans une zone donnée ¹.

Guidés par cette idée, nous avons choisi d’apporter une solution à la problématique antérieure en exploitant nos compétences en science des données et en apprentissage automatique. L’objectif serait donc de pouvoir estimer l’impact de la construction de nouveaux bâtiments publics sur la criminalité environnante.

À la recherche d’indices

Pour répondre à notre problématique, nous sommes partis de deux jeux de données de la ville de New York. Le premier recense les fusillades dans la ville avec leurs localisations depuis 2006 et comporte un peu plus de 27 000 lignes ². Le second nous donne accès aux plus de 30 000 bâtiments publics de la ville³ .

Les bâtiments sont regroupés selon 25 catégories différentes en fonction du domaine d’activité qui leur est lié : les plus nombreux sont ceux liés à l’enfance, aux transports et à la santé et les moins nombreux ceux liés aux télécommunications et à la justice. On peut observer ci-dessous quelle typologie de bâtiment est utilisée ainsi que le nombre de bâtiments de chaque type.

Répartition des types de bâtiments à New York

La tâche la plus dure à présent consiste à générer notre propre jeu de données pour établir les liens entre les bâtiments et les incidents de fusillade.

Comment lier nos indices entre eux ?

Pour cela, nous avons utilisé une approché basée sur les secteurs. Un secteur est une zone géographique dans laquelle nous recensons le nombre de chaque type de bâtiment ainsi qu’une mesure de la criminalité basée sur le nombre de fusillades.

Théoriquement, les secteurs peuvent adopter n’importe quelle forme, telle que celle des rectangles d’une grille par exemple, et possèdent une intersection qui peut être non-nulle : un chevauchement est donc possible.

Exemple de sectorisation (1304 secteurs de 1km x 1km)

Dans notre cas, nous avons utilisé des secteurs circulaires d’un rayon de 500 mètres, dont le centre est un bâtiment public de notre jeu de données Ainsi, pour chaque bâtiment nous obtenons un secteur : nous en avons donc au total plus de 30 000 ce qui sera très utile lors de l’entraînement des modèles.

La manière dont nous avons créé notre jeu de données est schématisée ci-dessous.

Dans le secteur centré autour de l’hôpital rouge, 5 tirs ont été tirés, dont 3 près d’une école, 1 près d l’hôpital, et 1 près du poste de police.

Sur cet exemple, nous avons additionné le nombre de tirs dans chaque secteur. En réalité, un traitement a été appliqué à ce nombre. En effet, plutôt que de parler en termes de nombre de tirs, ce qui est peu parlant – que signifierait “Placer un bâtiment ici a diminué le nombre de tirs de 2 sur 15 ans” ? – nous avons décidé de créer un indice évaluant la criminalité, basé sur le nombre de tirs.

Plus particulièrement, nous nous intéresserons à l’évolution de cet indice pour voir s’il est judicieux ou non d’implémenter un type de bâtiment public à un endroit donné : la différence entre avant et après la construction sera-t-elle positive ou négative ?

Pour cela, nous avons redimensionné la variable que nous cherchons à prédire (la mesure de criminalité) pour que ses valeurs soient comprises entre 0 et 1 de la manière suivante :

Appliquons cela à l’exemple vu précédemment. Il nous faut d’abord trouver les secteurs comportant le moins et le plus de tirs, correspondant donc respectivement à x_min et x_max de l’équation. Connaissant cela, nous pouvons maintenant appliquer la formule à toutes les valeurs.

Attribution de notre indice de criminalité à chaque secteur

Il nous semble important de mentionner pour les plus curieux d’entre vous que nous avons également choisi d’utiliser un index personnalisé de criminalité car il offre une adaptabilité et une possibilité d’affinement.

En effet, il existe par exemple des jeux de données recensant tous les crimes commis à New York ⁴.

On pourrait donc pousser davantage notre réflexion et notre démarche en utilisant toutes ces données en pondérant notre index par le degré de gravité du crime. A titre d’exemple, un vol pourrait compter pour un facteur de 1 et un meurtre pour un facteur de 100.

Cependant, comment pouvons-nous être sûr de l’efficacité de notre outil ?

Élémentaire mon cher Watson

Pour valider la crédibilité de notre approche, nous allons avoir recours à un critère de réussite : si nous vérifions le critère alors notre approche sera considérée comme valide.

Comme critère de réussite, nous allons procéder à une comparaison avec une méthode dite élémentaire (ou naïve) de détermination de l’indice de criminalité. Cette dernière se contente de prédire pour chaque secteur la moyenne de l’indice de criminalité. Mathématiquement, cela donne :

Si l’on reprend l’exemple précédent, l’approche élémentaire devrait prédire :

Prédiction du modèle élémentaire sur notre exemple

Comme vous pouvez le constater, cette approche, plutôt médiocre, prédit des valeurs de l’indice de criminalité assez éloignées de la réalité.

Ainsi, si nous sommes plus performants que cette méthode simpliste, nous pouvons considérer que notre approche est fonctionnelle et peut donner lieu à une application concrète.

Pour y parvenir, nous avons sélectionné plusieurs métriques caractérisant l’erreur à minimiser, à savoir la MSE (Mean Square Error), la MAE (Mean Absolute Error) et la RMSE (Root Mean Square Error) ainsi qu’une métrique expliquant la qualité de notre modèle vis-à-vis de la variance, le R²(R-Squared).

Par conséquent, en comparant ces métriques, nous serons en mesure de démontrer la supériorité de notre outil par rapport à la méthode naïve.

Le raisonnement

Nous avons implémenté différents modèles d’apprentissage automatique de régression pour pouvoir prédire l’indice de criminalité lors de la construction d’un nouveau bâtiment afin d’estimer l’impact sur la criminalité des nouvelles constructions.

Le but est donc, avec notre modèle, d’aider à la prise de décision les responsables de la planification urbaine de la ville de New York.

Nous nous sommes notamment penchés sur des Réseaux de Neurones et des Random Forest. Finalement notre choix s’est porté sur le Random Forest pour plusieurs raisons :

Premièrement, les résultats obtenus se sont révélés très prometteurs.
Ensuite, le temps d’exécution de notre algorithme restait raisonnable.
Enfin, cet algorithme nous permet d’avoir une vision plus précise de ce qui se passe avec notamment la possibilité de voir quelles données influencent le plus les prédictions, contrairement aux Neural Networks.

Le tableau ci-dessous nous montre bien les résultats obtenus à travers nos différents modèles. Nous remarquons aussi par ailleurs que nous validons largement notre critère de réussite.

Métriques	Random Forest	Neural Network	Modèle Naïf
MSE	0.00092	0.00340	0.02581
MAE	0.01519	0.04014	0.12742
R²	0.96446	0.86806	– 0.00005
RMSE	0.03029	0.05835	0.16067

Comparaison des modèles: toutes les métriques d’évaluation classent le Random Forest au premier rang

Graphique montrant l’importance de chaque feature pour notre modèle Random Forest

Comment résoudre l’enquête ?

Imaginons que vous êtes un planificateur urbain et que votre mission serait de construire une maison de jeu pour enfants.

Vous hésitez fortement entre 3 localisations que vous avez identifiées comme favorables selon des critères divers et variés.

Vous souhaitez prendre en compte l’impact de cette nouvelle construction sur la criminalité environnante ?

C’est ici que notre solution intervient.

Application du modèle sur 3 localisations réelles

Nos données nous fournissent l’indice de criminalité avant la construction, puis notre modèle prédit l’indice de criminalité après la construction de la maison de jeu pour enfants. Enfin, nous observons dans la dernière colonne ci-dessus l’évolution de cet indice de criminalité. Dans le cas présent la localisation C semble être le meilleur choix d’implantation si nous regardons le problème à travers le prisme de la criminalité.

Le verdict

Comme résultat, cet outil d’apprentissage automatique se positionne comme un allié de choix dans la prise de décision pour la planification urbaine à New York City, avec des performances élevées et aussi des opportunités d’amélioration.

Les résultats de l’évaluation de notre modèle, le RandomForest, ont surpassé nos attentes initiales. Sa précision remarquable dans la mesure de la criminalité, évaluée à travers les critères des erreurs à minimiser, ainsi que les indications détaillées sur l’importance de chaque caractéristique, confèrent à notre modèle une valeur exceptionnelle.

Cependant, il est essentiel de maintenir une approche prudente dans ce contexte. La planification urbaine est influencée par de multiples facteurs et ne peut se limiter à la seule considération de la criminalité. Par conséquent, bien que notre outil soit efficace, il doit être considéré comme une assistance à la prise de décision plutôt que comme une solution autonome pour les responsables de l’urbanisation.

Prise de recul

Malgré le succès évident de notre solution, nous sommes conscients de l’existence de tendances potentiellement risquées qui pourraient émerger en cas d’utilisation inappropriée de notre solution.

La première de ces tendances est la standardisation du type de construction à travers tous les secteurs, en se concentrant sur le type de construction ayant le plus grand impact sur l’indice de criminalité. Un certain point de saturation serait alors atteint, rendant notre modèle obsolète.

La seconde tendance impliquerait un déplacement à plus ou moins long terme de la criminalité. En effet, déplacer un problème vers une autre localisation ne le résout pas réellement. Cette réalité est malheureusement largement reconnue par ceux qui s’efforcent de réduire les taux de criminalité.

Et après ?

Plusieurs pistes d’amélioration ont été identifiées.

Diminution globale de la criminalité : Nous pourrions aller jusqu’à suggérer des emplacements d’implémentations de bâtiments publics plutôt que de simplement comparer des emplacements suggérés par les planificateurs urbains pour tenter de diminuer globalement la criminalité à New York.
Généralisation du modèle : l’intégration de jeux de données provenant d’autres villes nord-américaines pourrait enrichir notre modèle, entraînant ainsi une amélioration de ses performances et rendant la généralisation à la plupart des grandes villes américaines possible.
Amélioration des performances : la littérature suggère des liens significatifs entre la criminalité et le mouvement de population dans un secteur donné, rendant l’accès à des données de flux particulièrement valorisant.
Amélioration des performances et déplacement de la criminalité : l’inclusion d’informations sur l’année de construction des bâtiments permettrait d’apporter une dimension temporelle à notre modèle, gagnant ainsi en efficacité. Ceci permettrait également de quantifier le déplacement de la criminalité en voyant l’impact historique de l’implémentation des bâtiments sur la criminalité dans la ville.

Références

Urban Planning and Environmental Criminology: Towards a New Perspective for Safer Cities, Cozens, P. M. (2011) ↩︎
NYC OpenData. NYPD Shooting Incident Data (Historic). Disponible sur : https://catalog.data.gov/dataset/nypd-shooting-incident-data-historic ↩︎
NYC Planning. NYC Facilities Database (FacDB). Disponible sur : https://www.nyc.gov/site/planning/data-maps/open-data/dwn-selfac.page ↩︎
NYC OpenData. NYPD Complaint Data (Historic). Disponible sur : https://data.cityofnewyork.us/Public-Safety/NYPD-Complaint-Data-Historic/qgea-i56i ↩︎

Trouvez la bouteille qui sublimera votre recette !

Par Sean BONNEMAINS, Hélène SAVATIER-DUPRE, Maxime BOILLOT, Jonathan ADERKAOUI, élèves du parcours Data Science.

Inscrite au patrimoine mondial immatériel de l’UNESCO, la gastronomie française tient une place spéciale dans le cœur des français. L’art du “bien boire” et du “bien manger” est ancré profondément dans nos coutumes, tant et si bien que pour de nombreux français le vin et les repas cuisinés sont indissociables : 90% des repas avec invités ont une bouteille de vin à table, 92% des français associent l’image du vin à un plat, 88% associent le vin à la convivialité et au partage,…ces chiffres de l’IFOP Vins&Société ont de quoi vous donner le tournis !

Quelques chiffres sur les relations entre vin et repas

Mais si, vu de l’étranger, tout français maîtrise cet art de vivre dès la naissance, la réalité est toute autre : plus qu’un art, être capable de proposer à ses convives un repas dont les saveurs sont sublimées par une gorgée de la judicieuse bouteille de vin que vous aurez choisi pour l’accompagner est une science. Qui ne s’est jamais retrouvé dans cette situation : vous invitez vos amis à dîner chez vous, passez de nombreuses heures à étudier les recettes Marmiton à la recherche de l’inspiration, sélectionnez LA recette parfaite, partez en courses, dénichez les ingrédients nécessaires, arrivez enfin au rayon vins de votre supermarché favori et là… c’est le drame. Vous vous retrouvez devant ce mur de bouteilles et vous n’avez aucune idée de laquelle choisir. Blanc pour le poisson, rouge pour la viande : c’est bien beau tout ça, mais ça laisse quand même beaucoup d’options. Finalement, par dépit, vous partez avec une bouteille assez chère (c’est gage de qualité) et dont le design vous aura attiré l’œil. Si vous vous reconnaissez ici, vous connaissez la suite : l’accord entre votre repas et votre bouteille a de forte chance d’être hasardeux.

Sommes nous condamnés à cette incertitude, à ce pic de stress additionnel à chaque grande occasion dont nous sommes les hôtes, nous cuisiniers amateurs n’ayant pas eu la chance de naître avec un oncle sommelier ? Peut-être pas.

Et si notre meilleur ami Marmiton venait à notre rescousse et nous suggérait la bonne bouteille pour la recette que vous venez de précieusement enregistrer dans vos favoris ?

Marmiton à la rescousse…c’est possible ?

Pourquoi diable Marmiton irait vous proposer une telle fonctionnalité ?

Tout d’abord parce que c’est une fonctionnalité qui s’inscrit parfaitement dans les valeurs de l’entreprise, à savoir plaisir, générosité, accessibilité et convivialité.

Ensuite parce que c’est une fonctionnalité innovante non présente chez ses concurrents qui potentiellement améliorerait l’expérience utilisateurs de ses clients (on est quand même pas les seuls à vouloir une telle fonctionnalité, si ?).

Enfin et surtout, parce que cela permettrait de générer de nouveaux revenus de partenariat avec des vendeurs de vins en ligne en échange de nouveaux canaux d’acquisition de clients pour eux.

Alors, pourquoi pas ?

Et techniquement, c’est réalisable ?

Comment s’y prendrait-on si l’on voulait mettre en place ce type de service ? C’est l’excellente question à laquelle nous avons essayé de répondre. Tout d’abord il faudrait mieux comprendre comment se réalisent les accords mets – vins : sur quels critères gustatifs se réalisent ils ? Quels ingrédients prennent le dessus sur d’autres ? Quel est l’impact de la cuisson des plats ? Comment caractérise-t-on les vins ? Qu’est ce qui différencie une appellation d’une autre ? …autant de questions qui restent sans réponse.

Quelques lectures plus tard, on commence à y voir (un peu) plus clair : les poissons et les viandes sont souvent l’élément décisionnaire de l’accord de vin pour un plat, ces derniers peuvent être caractérisés gustativement par leurs types de cuissons, les vins ont des caractéristiques tanniques, de fraîcheur ou encore de rondeur du fait de leurs cépages, de leur sol…

Si on peut caractériser des recettes et des vins par autant d’attributs, ne pourrait-on pas faire ressortir des corrélations qui permettent de proposer un accord pertinent pour une recette donnée ? Ne pourrait-on pas appliquer des méthodes de Data Science pour recommander ces accords mets-vins ?

Des données, des données et encore des données

Afin de vérifier ces hypothèses, il nous faut des données sur des accords mets et vins. Malgré le bien fondé de l’existence d’une telle base de données (surtout lorsque la période des fêtes approche à grands pas), il s’avère qu’il n’en existe pas. Afin de pallier ce problème, nous avons retroussé nos manches et commencé à constituer une base de données en utilisant une méthode à la limite de la légalité afin de collecter des données sur internet : le scrapping. Ces techniques, tolérées à des fins éducatives ou de recherche, permettent d’utiliser des robots qui parcourent le code des pages web afin de collecter les données qui y figurent.

Après des dizaines d’heures et quelques centaines de lignes de codes, le dataset est constitué :

les attributs des recettes (leur intitulé, la catégorie de plat associé et les ingrédients utilisés) sont collectés sur Marmiton,
ceux des vins (scores sur les goûts notamment le caractère tannique ou frais, les taux de sucre, les cépages, les appellations et leur description “sommelière” notamment) sur Nicolas et V&B,
et les bons accords mets vins sont tirées de l’ouvrage de Olivier Bompass, Les Vins et les Mets en 2500 Accords (on y trouve un nom de recette auquel est associé sa catégorie de plat, la typologie de vins suggérés – e.g. rouge, blanc..-, une description gustative des vins et des appellations correspondantes).

Au travail maintenant !

Data Science : du buzzword aux méthodes concrètes

Dire que l’on va appliquer des méthodes de Data Science n’apporte pas beaucoup d’informations sur la manière de modéliser et traiter le problème. Afin de recommander une bouteille de vin à partir d’une recette, nous avons envisagé différentes traductions en problèmes de Data Science : nous en détaillerons ici deux.

La première consiste à développer un système de recommandations basé sur une analogie au principe de Content-Based Filtering : une recette de notre base d’accords se marie bien à certains vins, la recette fournie par l’utilisateur est similaire à cette recette, donc potentiellement les mêmes vins pourraient lui convenir.

Première approche de système de recommandation

La seconde consiste à effectuer un apprentissage supervisé qui prend en entrée les attributs de la recette et la classifie selon le type de vin qui lui correspond le mieux (à un niveau basique sur la typologie, et pour aller plus loin sur la description gustative).

Seconde approche d’apprentissage supervisé

Ces deux approches nécessitent d’exploiter des données textuelles, notamment celles contenues dans les intitulés des recettes et dans les listes d’ingrédients. Afin de permettre aux algorithmes d’utiliser ces données, il nous a fallu utiliser des méthodes de NLP (Natural Language Processing, un champ du Machine Learning qui permet de traiter les langages) afin de les encoder sous formes de vecteurs pour pouvoir par la suite effectuer des calculs dessus. Concrètement, après un pré-processing des données afin d’isoler les termes les plus porteurs de sens des textes, il s’agit de choisir la méthode de vectorization la plus adaptée à leur contexte pour les représenter : c’est l’étape de « Word Embedding ».

Champagne…?

Les résultats obtenus avec ces deux approches sont plutôt encourageants.

Pour le système de recommandation, la mise en place d’un test d’évaluation de la pertinence des recommandations de recettes similaires pour 20 recettes nous a permis d’évaluer sur 100 points différentes méthodes de NLP appliquées aux intitulés des recettes et aux listes d’ingrédients (pour les plus curieux, la similarité entre les vecteurs est évaluée par la mesure cosinus, pour s’affranchir des problèmes de dimension variable des textes).

Les algorithmes permettant d’obtenir les meilleurs scores tout en affichant une meilleure robustesse – compte tenu des biais de notre système d’évaluation – sont ceux combinant les mesures de similarité sur les ingrédients (avec TF-IDF) et celles sur les intitulés de repas (avec des Bag of Words).

Performances systèmes de recommandation (NLP)

Pour la deuxième approche, appliqué au cas plus simple de la classification sur le type de vin (rouge, blanc, rosé ou effervescent), les algorithmes supervisés ayant montré les meilleures performances sont le Support Vector Classifier et la Régression Logistique, qui parviennent à 75% de bonnes classifications sur notre base de test.

La mise en bouteille, c’est pour quand ?

Si les preuves de concept sont encourageantes, nous sommes encore loin de voir cette fonctionnalité apparaître sur Marmiton (désolé, pour ce réveillon il faudra se creuser la tête pour ne pas fâcher Mamie). Au-delà des problématiques dues au développement de la fonctionnalité sur l’application et à l’hébergement des modèles, différentes étapes peuvent et doivent être mises en place avant de pouvoir lancer un produit.

D’un point de vue algorithmique, le système de recommandation a été évalué partiellement sur la pertinence des recettes similaires proposées mais pas sur l’accord de bouteille obtenu : l’analyse de retours d’utilisateurs permettrait de mieux apprécier la qualité de nos recommandations – et par la même occasion, l’appétence des clients pour ce type de service ! -, tout comme l’évaluation de la qualité des recommandations par un sommelier professionnel. D’autres techniques de NLP peuvent être mises en place pour améliorer la précision ou exploiter d’autres attributs de notre base de données (analyse de sentiments et d’intentions dans la description des vins notamment). Enfin, la base de données pourrait être étendue pour de meilleures performances algorithmiques : la data augmentation, en modifiant certains ingrédients mineurs des recettes, est une piste envisageable.

D’un point de vue business et juridique, selon l’appétence des utilisateurs le modèle de génération de revenus doit être pensé et des accords passés afin de se procurer les droits sur l’usage des données (le scrapping n’est pas légal à des fins commerciales). La suggestion de bouteilles de vin doit également être légalement encadrée pour éviter des accusations de “parasitisme” (une atteinte à l’image d’un produit en voulant utiliser son image de marque, par exemple ici si une bouteille de prestige est associée à un repas “banal”).

D’un point de vue éthique, enfin, la recommandation de bouteilles d’alcool peut inciter à la consommation d’alcool : il faut se conformer aux lois en vigueur sur ces questions de santé publique pour proposer les recommandations dans un format en adéquation avec celles-ci.

Bibliographie

https://ich.unesco.org/fr/RL/le-repas-gastronomique-des-francais-00437 , la gastronomie française au patrimoine mondial de l’Unesco
https://www.vinetsociete.fr/barometre-ifop-et-v-s-les-francais-et-le-vin, étude IFOP Vins&Société, 2019
https://www.vinetsociete.fr/sondage-ifop-vin-habitudes-alimentaires, étude IFOP Vins&Société, 2022
https://businessofbouffe.com/podcast/christophe-duhamel-marmiton, podcast sur l’histoire de Marmiton et son Business Model avec l’un de ses fondateurs, Christophe Duhamel
Les Vins et les Mets en 2500 Accords, Olivier Bompass, Hachette Vins
https://towardsdatascience.com/introduction-to-recommender-systems-1-971bd274f421, introduction aux systèmes de recommandation
https://towardsdatascience.com/word2vec-explained-49c52b4ccb71 , explication des différences entre les modèles CBOW et SkipGram
https://towardsdatascience.com/how-tf-idf-works-3dbf35e568f0 , calcul de TF-IDF et importance relative des mots très fréquents
https://selenium-python.readthedocs.io/ ,documentation de Selenium, un outil de web-scrapping

Modèle économique de Krita

Introduction

Aujourd’hui, le digital painting (peinture numérique) est utilisé dans de nombreux studios d’animation ou par des créateurs qui souhaitent partager leurs œuvres rapidement et efficacement. La flexibilité et la portabilité qu’offre ce moyen de faire du dessin est un avantage maintenant incontournable et permet un gain de temps et d’argent aux créateurs qui souhaitent numériser leur production à moindre prix [1].

Krita, lancé en 1998 par la communauté KDE, est un projet open source proposant une solution gratuite de logiciel conçue pour le digital painting et la retouche d’image matricielle. Il s’inscrit dans le projet KDE visant à créer un bureau UNIX avec de nombreux logiciels utiles au quotidien [2]. Après un développement qui a tardé à commencer, une première version de Krita est lancée en 2003, et à partir de 2009, Krita se spécialise dans le dessin. En 2013, la fondation Krita est créée pour la gestion du projet [3].

Pour cette nouvelle année, Krita passe en version 5.0, de quoi offrir du nouveau contenu à ses utilisateurs et de satisfaire sa communauté grandissante.

Dans ce rapport, nous étudierons d’abord le marché dans lequel évolue le logiciel. Ensuite nous analyserons sa stratégie économique et enfin, nous verrons les ressources législatives dont dispose Krita pour assurer sa stabilité et sa durabilité.

Marché du logiciel

1.1) Besoins

Krita étant un logiciel de dessin numérique et de retouche photo, il se place dans un marché très spécifique et en constante évolution [4].

Ainsi, les logiciels de ce marché doivent proposer une grande variété de fonctionnalités sur la gestion de la couleur et de l’apparence, répondant à des attentes précises et techniques.

Mais proposer un très large choix de fonctionnalités pour des logiciels de retouche photo est inefficace si celles-ci ne sont pas disponibles facilement et intuitivement. Ainsi le premier critère de choix est l’interface [5] pour la majorité des utilisateurs, c’est-à-dire les particuliers peu à cheval sur la technique avancée des fonctionnalités [4].

Ainsi, il est primordial de proposer une bonne interface pour ce marché et cela consiste de permettre à l’utilisateur de faire usage des fonctionnalités de manière simple et intuitive afin que les nouveaux arrivants ne perdent pas trop de temps dans l’apprentissage des services proposés. Ensuite, il est très apprécié que l’interface soit personnalisable afin que chaque utilisateur se sente libre dans la manière d’utiliser le logiciel et cela permet aussi à des personnes qui utilisaient un autre logiciel, de se rapprocher d’une configuration qu’ils connaissent déjà qui est donc plus facile à prendre en main [6].

On peut donc voir que l’interface est une véritable barrière à l’entrée des nouveaux utilisateurs. Par ailleurs ces nouveaux utilisateurs sont très demandant d’une documentation et de tutoriels afin de commencer leur utilisation et c’est un point à ne pas négliger [5]. La diversité et la facilité d’accès à des tutoriels sur des plateformes telles que YouTube pour Krita [7] est notamment très utile si l’on souhaite toucher une clientèle plus jeune.

En effet, pour un logiciel libre et gratuit, les étudiants sont une cible principale car ceux-ci possèdent moins de moyens pour se procurer un logiciel payant dont le prix peut s’avérer élever, d’autant plus qu’ils sont, pour la plupart, sur une période d’apprentissage. Ainsi, il est plus naturel pour ceux-ci de se tourner vers une solution moins coûteuse.

Afin de se démarquer sur le marché des logiciels de modification de photo, il ne suffit pas d’avoir une bonne facilité d’accès et d’utilisation, il faut aussi une diversité de services importante afin de répondre aux attentes d’un maximum d’utilisateurs et des fonctionnalités performantes et techniques pour satisfaire une clientèle plus professionnelle [4].

Parmi les nombreuses fonctionnalités que peuvent proposer ces logiciels, on peut citer des fonctionnalités principales qui constituent l’attente qu’un client peut avoir pour un logiciel libre et dont la performance permet de faire un classement entre les différents logiciels [8].

Tout d’abord, il est nécessaire pour un logiciel permettant le montage photo de posséder des outils de sélection efficaces. En effet, ces outils permettent de ne modifier qu’une partie de l’image choisie par l’utilisateur, autrement dit, cette action est à la base de toute retouche locale. Ainsi, si ces outils sont automatisés et performants, l’utilisateur gagnera du temps sur ses montages et ceux-ci seront plus précis et fins [9].

Ensuite, une fois qu’une partie d’une image a été sélectionnée, afin de pouvoir faire des modifications dessus ou ajouter des éléments, il est nécessaire d’avoir une gestion de calques. De fait, cet outil permet de superposer des éléments et de les traiter indépendamment du reste de l’image. Ainsi, une gestion avancée de cet outil permettra à l’utilisateur de garder facilement son montage organisé [10].

Pour continuer, il parait logique pour un logiciel de montage photo de proposer des outils avancés de gestion et d’affichage de la couleur. En effet, la plupart des modifications font appel à un traitement et à une gestion de la couleur [11]. Il est alors avantageux pour un logiciel de montage photo de posséder des technologies avancées dans la gestion de la couleur.

Ensuite, un logiciel plutôt orienté vers le dessin tel que Krita aura besoin de fonctionnalités plus spécifiques en plus des outils de retouche photo.

En effet, le dessin informatique requiert l’utilisation d’une tablette graphique afin d’être plus précis en plus d’offrir une expérience plus similaire au dessin traditionnel [12]. Il est donc important pour un logiciel de dessin d’avoir une gestion avancée de celle-ci afin de permettre à l’utilisateur d’être plus précis et donc plus performant dans ces dessins.

Le matériel peut accélérer ou non l’efficacité du logiciel puisque certaines tablettes graphiques sont plus performantes que d’autres, que ce soit au niveau de la sensibilité (plus ou moins de niveau de sensibilité) ou de la technologie (tablette avec écran ou non) [57].

Enfin, de nombreux utilisateurs font de l’animation grâce aux logiciels de dessin, et par conséquent, la gestion de celle-ci devient un critère important lors du choix du logiciel [12].

Ainsi, Krita, comme ses concurrents, doivent répondre à un grand nombre d’attentes des utilisateurs qui ont des besoins variés, spécifiés et techniques tout en leur proposant une utilisation facilitée de fonctionnalités avancées.

1.2 Concurrents

Pour répondre aux besoins des utilisateurs, de nombreux logiciels de retouche photo et de dessin sont disponibles, mais parmi les plus influents, on peut en ressortir quatre :

Krita est un logiciel de retouche d’image matricielle. Il se définit comme un logiciel professionnel et gratuit afin de donner des outils artistiques performants à tous, professionnels ou amateurs [13].

Sa fonction première est la retouche d’image matricielle mais il s’oriente vers le dessin numérique et l’animation 2D.

Ce logiciel étant fait pour les artistes, il intègre très bien la tablette graphique avec une réponse au stylet très précise selon la pression appliquée [14].

Photoshop de son côté est une référence dans le monde de la retouche photo au point de donner un verbe « photoshoper » qui désigne dans un langage courant l’action d’éditer une image [15]. Ce logiciel, présent depuis 1990, a pour ambition de répondre à une clientèle professionnelle en proposant tous les outils nécessaires et avec succès comme le montre la figure 2, Photoshop vient plus naturellement quand on pense logiciel d’édition d’image. De plus, celui-ci est facilement piratable et est un des logiciels les plus piratés. On peut d’ailleurs penser que l’accès facile à une copie illégale du logiciel est un choix d’Adobe afin de permettre aux potentiels utilisateurs de se former avant d’acquérir une licence. Cela place donc Photoshop comme l’un des concurrents principaux de Krita.

Ensuite, Gimp, dans une démarche similaire à Krita, propose un service de retouche photo gratuitement pour pouvoir donner à tous des outils d’édition d’image performants en se rapprochant de la qualité de Photoshop et en proposant plus de personnalisation. La démarche étant similaire à celle de Krita, cela fait de Gimp un concurrent principal de Krita.

Enfin Paint Tool Sai se rapproche de Krita en tant que logiciel de dessin numérique avec une application légère et personnalisable, ce logiciel propriétaire propose de nombreuses fonctionnalités de dessin avancées tout en permettant une grande personnalisation des outils comme le propose Krita [16].

On peut donc comparer ces quatre concurrents à l’aide du tableau suivant :

	Krita	Photoshop	Gimp	Paint Tool Sai
Spécialisation	Dessin/animation	Edition photo	Edition photo	Dessin
Support	Windows, MacOS, Linux, ChromeOS(Beta) , Android(Beta)	Windows, MacOS, Android, iOS	Windows, MacOs, Linux	Windows
Prix	Gratuit	23.99€/mois	Gratuit	5500JPY (soit 42€)
Fonctionnalités spécifiques permettant aux logiciels de se démarquer	– Générateur de brosses – Editeur de calques- Intégration d’OpenGL (fonctions de calcul d’image 2D et 3D [17]) pour un rendu très rapide- Support HDR (technologie d’ajustement des intensités lumineuse [18])- Outils de transformation- Assistants dessin – Outils de miroir- Couverture CMYK (format de couleur pour les imprimantes [19])- Personnalisation de l’interface	– Outils de lissage – Lightroom (outil de gestion de flux de production photographique [20])- Gestion des polices- Outils de courbure- Outils d’édition d’image 360- Couverture CYMK [19]	– Personnalisation de brosses- Précision inférieure au pixel pour les outils de peinture- Compatibilité de scripts (python, scheme, perl)- Format MNG (format d’animation [21])- Personnalisation de l’interface	– Gestion avancée de la couleur- Gestion avancée des calques- Technologie anti-aliasing- Support de la technologie Intel pour un rendu plus rapide- Légèreté de l’application

Tableau 1 : Comparaison des fonctionnalités entre Krita, Photoshop, Gimp et Paint Tool Sai [14] [22] [23] [24] [25]

Contrairement à Photoshop, Krita propose un large choix de personnalisation que ce soit au niveau des outils comme les brosses ou les filtres mais aussi dans la personnalisation de l’interface avec notamment une API python pour plus de personnalisation [26].

Concernant les outils, Krita décrit sur son site les nombreuses brosses personnalisables créés par des membres de la communauté. En effet, le logiciel propose 18 générateurs de brosse [27], et cela permet aux artistes de créer des ensembles de brosses répondant à leurs besoins propres.

Les fonctionnalités de stabilisateurs de brosse et d’assistants aux dessins sont décrites comme très appréciées par leurs utilisateurs car comme le précise Krita, elles permettent de perfectionner les tracés et de créer plus rapidement des effets tels que l’intégration d’une perspective curviligne [28].

Ainsi Krita se place dans une démarche plus proche de l’utilisateur en s’adaptant à leurs volontés et leurs habitudes. Krita est donc plus « user-friendly » contrairement à Photoshop qui est beaucoup plus rigide dans la présentation de son interface.

Par conséquent le coût de Photoshop est beaucoup plus élevé que Krita ou Gimp que ce soit financièrement mais aussi en termes de coût d’entrée car il faut s’adapter aux fonctionnalités et à l’interface.

De son côté, Gimp est assez équivalent à Krita du point de vue de la personnalisation de l’interface et la possibilité d’ajout de modules et plugins produits par des contributeurs. Cependant, Gimp est plus orienté vers la retouche photo.

Par ailleurs, le succès de Krita tire son origine dans la grande diversité d’utilisateurs pour lesquels Krita s’adresse.

Tout d’abord, Krita est disponible sur de plus en plus de systèmes d’exploitation. En 2020, c’est sur Chrome OS et sur Android que Krita fait son apparition [1]. Cela a pour effet d’élargir le champ des utilisateurs et donc le nombre de téléchargement mais aussi de complexifier son développement.

Le passage du logiciel à Android et ChromeOS permet d’étendre le logiciel pour les utilisateurs de tablettes puisque certaines tablettes sont optimisées pour le dessin numérique. En effet, utiliser une tablette peut présenter plusieurs avantages par rapport à une tablette graphique puisqu’on n’a pas à la brancher sur son ordinateur, la tablette sous Android s’occupe de faire tourner le logiciel. Ainsi, Krita vient répondre à un tout nouveau besoin des utilisateurs permettant de capter une clientèle ciblée et par conséquent, d’augmenter son nombre d’utilisateurs.

Ensuite, pour faciliter l’arrivée de nouveaux utilisateurs, Krita dispose d’un grand nombre de tutoriels disponibles sur son site internet [29] afin de rendre le logiciel plus accessible. Krita propose aux utilisateurs qui souhaitent apprendre le dessin des tutoriels sur les principes de bases du dessin [30], afin d’attirer de nouveaux utilisateurs néophytes.

Afin de réduire le coût d’apprentissage pour les utilisateurs venant de logiciels concurrents, Krita permet de configurer les raccourcis du logiciel avec les mêmes raccourcis que Photoshop, Gimp et PaintToolSai [figure 9 en annexes].

Comme pour beaucoup de logiciel, la productivité du logiciel dépend du degré de maîtrise de celui-ci. En effet plus l’utilisateur connaît le produit, plus il sera efficace sur celui-ci et pourra explorer les nombreuses fonctionnalités du logiciel.

Ainsi, un expert de Photoshop, Gimp ou Paint tool SAI pourra facilement passer à Krita avec un temps très court d’adaptation. Cependant, l’inverse est aussi vrai, un expert de Krita pourra facilement passer à un logiciel concurrent avec un peu de pratique.

On peut donc placer les trois logiciels sur le graphique suivant :

Figure 1 : Caractérisation des logiciels Krita, Photoshop et Gimp (plus on est haut, plus on est personnalisable, plus on est proche de variété, plus on propose de fonctionnalités efficaces, plus on est proche du coût, plus celui-ci est faible).

1.3) Krita dans le marché

a) Développement de la communauté

Krita a développé un aspect communautaire fort avec une activité importante sur les forums tels que Reddit avec plus de 52 000 abonnés [31] et des post tous les jours. Krita s’étant fait connaitre plus récemment que ses concurrents, sa communauté reste moins importante que celles de Gimp (174 000 abonnés sur Reddit [32]) ou Photoshop (455 000 abonnés sur Reddit [33]). Mais Krita a aussi lancé en 2019 son forum dédié : Krita-artistes [34] qui compte 13 000 utilisateurs dont plus de 1 000 actifs sur le mois dernier.

De plus, une chaîne YouTube [7] de plus en plus active avec 43 000 abonnés et une vidéo mensuelle permet à une clientèle plus jeune et étudiante de prendre en main le logiciel au travers de tuto et de progresser.

Ainsi Krita a encore besoin de se développer pour atteindre l’influence de ses concurrents, en témoigne le nombre de recherches sur google de Krita et de ses deux principaux concurrents. Mais sa présence de plus en plus active sur de nombreux réseaux sociaux présagent un gain de popularité et donc de stabilité pour le logiciel.

*Figure 2* *: Analyse des recherches des termes « krita », « photoshop » et « gimp » [35]*

Le bouche à oreille est primordial chez Krita, puisque c’est celui-ci qui, couplé à la réputation du projet, attire de nouveaux utilisateurs. En effet, le nombre d’utilisateurs est en constante augmentation comme le montre la figure ci-dessous. Entre 2019 et 2020, le nombre de nouveaux téléchargements uniques a doublé, passant de 2,35 millions à 4,85 millions en 2020 [61]. En 2021, c’est près de 80 000 nouveaux téléchargements par semaine [62] qui sont effectués uniquement sur le site de Krita et ce chiffre augmente encore.

Figure 3 : Évolution du nombre de téléchargements uniques entre 2018 et 2020(figure réalisée à l’aide de [61-62])

D’abord, l’utilisation de Krita par des artistes professionnels contribue à la popularité de Krita. On peut citer David Revoy [63] qui se définit comme un utilisateur confirmé de Krita et ayant réalisé une BD entièrement avec le logiciel. La mise en place d’un forum krita-artist [34] où chacun publie ses réalisations avec le logiciel permet également d’accroitre la popularité du logiciel en montrant ce que l’on peut produire avec le logiciel par des projets finis.

De plus, en donnant l’autorisation de montrer l’interface par le biais de la licence [64], de nombreuses vidéos tutoriels de Krita ou des streams de personnes utilisant le logiciel ou encore des times laps (vidéo accélérée) sont mises en ligne sur des plateformes vidéo comme Youtube ou Twitch. Cela contribue grandement au succès de Krita puisque ces vidéos sont susceptibles d’attirer de nouveaux utilisateurs au logiciel. Cela donne un attrait pour les débutants du domaine puisque le logiciel semble accessible, par la présence de nombreux tutoriels.

L’intégration du logiciel à KDE [41] joue un rôle clé puisqu’elle permet d’étendre le réseau dans la communauté KDE d’une part mais aussi d’étendre son réseau dans la communauté open-source en utilisant la réputation et l’image de marque de KDE.

Krita a également reçu plusieurs donations d’entreprises comme FossHub ou encore Gamechunk [56]. Le projet a également reçu un soutien financier d’Epic Games à travers le programme Mega Grants, ce qui témoigne du professionnalisme du logiciel [65].

Ainsi, on a d’autant plus d’intérêt à utiliser Krita que le nombre d’utilisateur augmente puisque d’une part, on trouvera de nombreuses ressources pour nous aider à prendre en main le logiciel. Plus la communauté est importante et active, plus on trouvera facilement un interlocuteur pour parler du logiciel. De plus, plus le logiciel est populaire, plus les donations et les contributions sont nombreuses et donc plus longtemps le logiciel sera maintenu.

b) Économie d’échelle

A priori, le logiciel ne proposant pas de services premium ou autres abonnements et ne faisant pas payer le logiciel, aucune économie ou déséconomie d’échelle ne semble pouvoir être mentionné. En effet, une fois l’exécutable téléchargé, le logiciel tourne en local sur l’ordinateur de l’utilisateur, ne dispose pas de sauvegarde en cloud et n’utilise les infrastructures de Krita uniquement pour vérifier et au besoin installer les mises à jour.

Cependant, une économie d’échelle peut être trouvé dans le sens où plus le nombre d’utilisateur sera élevé, plus les dons et les contributions seront conséquents puisque plus d’utilisateurs seront susceptibles de donner ou contribuer au logiciel. Cela aura ainsi pour conséquence direct une augmentation de fonctionnalités du logiciel ainsi qu’un maintien voire un gain de qualité avec l’apport de fix et de mises à jour. Ce gain de qualité va directement se répercuter sur le nombre d’utilisateur qui devrait grimper et qui à son tour va donner plus de moyen à Krita pour se développer. Ce cercle vertueux peut être vu comme une économie d’échelle même si celle-ci est indirecte et est en réalité plus complexe puisque que le nombre d’utilisateur peut augmenter tandis que le nombre de contributions ou de dons peut rester stable voire diminuer.

L’utilisation du logiciel par des entreprises réputées du monde du jeu vidéo, de l’animation ou de la VFX, contribuent également à la popularité du logiciel. Les donations des entreprises permettent un maintien du logiciel et permette à ces entreprises de se déresponsabiliser du fonctionnement du logiciel et fonctionne comme une sous-traitance moins coûteuse. En effet, contribuer au projet open-source permet de développer le logiciel, voir l’apparition de fonctionnalités répondant à nos besoins tout en laissant la gestion du projet à la communauté open-source. Ainsi, une hausse du nombre d’utilisateurs tend vers une augmentation des revenus du projet et donc à une captation de valeur plus grande.

À l’inverse, l’augmentation du nombre d’utilisateurs n’implique pas une évolution des coûts. En effet, le coût de maintien du logiciel reste le même quel que soit le nombre d’utilisateur. Cependant, une hausse des utilisateurs augmente la chance de trouver un bug même si cet aspect reste minime au vu du nombre d’utilisateur et de la taille du projet.

c) Krita et interopérabilité des logiciels

Comme explicité précédemment, Krita est disponible sur Windows, MacOS, Linux et bientôt Android et ChromeOS. Cette disponibilité sur presque tous les OS permet de s’adapter et de reprendre ou envoyer des projets sur des appareils avec des systèmes d’exploitation différents. Le travail en multi-plateforme est possible, et ce en grande partie grâce à l’utilisation de Qt [42].

De plus, Krita permet d’exporter le projet en plusieurs extensions listés dans la figure en annexe [figure 7]. On remarque qu’on peut exporter un projet de Krita en un projet Photoshop avec l’extension .psd (extension native de photoshop).

Cependant, on ne peut pas exporter un projet de Krita directement à Gimp avec l’extension *.xcf (extension native de Gimp). On peut cependant passer par l’extension *.ora qui permet de faire le lien entre la grande partie des logiciels de retouche d’image matricielle open-source [60].

Krita peut ouvrir de nombreux formats de fichiers comme listé en annexes [figure 8]. On notera la présence de fichiers *.ora et *.psd qui permettent d’ouvrir des projets Photoshop et Gimp dans Krita.

Le fait de pouvoir facilement passer d’un logiciel à l’autre permet de faciliter la collaboration des utilisateurs utilisant différents logiciels. Cependant, cela peut inciter les utilisateurs à utiliser plusieurs logiciels pour travailler. Certains utilisateurs peuvent utiliser Krita pour certaines fonctionnalités, et passer sur les logiciels concurrents pour d’autres fonctionnalités. Cette interdépendance entre les logiciels est également pratique pour pouvoir travailler en collaboration et pour avoir accès au besoin à des fonctionnalités propres aux logiciels et cela constitue un avantage non négligeable pour les utilisateurs en besoin de performances spécifiques. On peut imaginer un utilisateur travailler sur une retouche photo sur Photoshop puis passer à Krita pour finaliser son projet car il a besoin d’une personnalisation importante de brosses.

Cette interdépendance était néanmoins nécessaire pour le projet puisque pour pouvoir se faire une place dans le marché du logiciel de dessin numérique, le logiciel doit s’adapter aux autres logiciels dominants du secteur tel que Photoshop ou Gimp pour pouvoir s’insérer dans le marché et s’y développer.

Modèle d’affaire de Krita

Ressources clés et activités du projet

Krita doit répondre à une forte demande technologique de fonctionnalités variées et personnalisables comme nous l’avons vu dans la partie précédente.

Tout d’abord, afin de proposer de nouvelles fonctionnalités et les mettre à jour, Krita s’est orienté vers une programmation open-source [36]. En effet, cela permet aux utilisateurs qui souhaitent voir de nouvelles fonctionnalités, de les ajouter à l’application en contribuant au projet ou en demandant à d’autre membres de la communauté de les implémenter.

Ce modèle est bénéfique pour la fondation car les utilisateurs peuvent satisfaire par eux-mêmes leur demande. Mais cela nécessite une bonne organisation afin de conserver une intégrité et une stabilité globale.

Pour cela, le code source du projet est hébergé chez GitLab [37]. Celui-ci a pour but de concentrer les ajouts et modifications faites par les contributeurs.

Un outil de tracker de bugs, Bugzilla, a été mis en place [38], facilitant non seulement l’envoi de rapports de bugs pour les utilisateurs, mais également les contributions à apporter. Cela permet d’automatiser le suivi du logiciel et de pouvoir facilement repérer les tâches à effectuer.

L’organisation du travail était gérée sur Phabricator, qui est un outil de gestion de projet, de suivi de problèmes et de revue de code. Cependant, celui-ci n’est plus actif (la dernière tâche date de 2017) et l’organisation du travail est passée sur Bugzilla qui permet de faire le même travail que Phabricator.

Les contributions sont une ressource primordiale pour le projet, puisque sans celles-ci, le logiciel ne serait pas maintenu et resterait au point mort.

Une fois que des nouvelles fonctionnalités sont implémentées et que certains bugs sont corrigés, l’application Krita est mise à jour pour les utilisateurs afin que ceux-ci puissent en bénéficier dans un environnement testé et fonctionnel. Ces mises à jour, tout comme l’avancée du projet et les volontés pour le futur du projet sont annoncées au travers de notes de mises à jour [39].

Cette communication est une activité très importante pour Krita, en effet, celle-ci permet aux utilisateurs de s’adapter plus facilement aux nouvelles fonctionnalités et c’est aussi un reflet sur la dynamique du projet. Par conséquent un utilisateur se sentira plus écouté et soutenu s’il voit des mises à jour régulières s’effectuer et sera donc plus apte à s’impliquer dans le projet.

Pour proposer ce service, Krita se repose sur son site web [39], un outil qui concentre toutes les informations principales sur le logiciel et son développement.

Krita ne se définit pas seulement par son code source, un logiciel ou sa communauté, il s’agit aussi d’une marque déposée. La marque Krita, son logo ainsi que la mascotte sont propriétés de la fondation Krita [68].

L’utilisation d’une marque permet plusieurs avantages, notamment de se protéger contre des utilisations abusives de l’image de marque du logiciel. En effet, la fondation possède le monopole d’exploitation de la marque pour distribuer son logiciel mais aussi pour la communication. Bien que la licence du logiciel permette une redistribution par un tiers, si le logiciel diffère du projet initial, la marque et tout ce qui lui est associé (logo, nom etc.) ne peut pas être utilisé pour la redistribution. La marque est propriété de la fondation et est juridiquement protégée. La marque permet également d’avoir un contrôle sur l’usage et la collaboration du code.

L’utilisation d’une marque permet non seulement de se protéger mais aussi de se créer une identité forte et de se distinguer face aux concurrents et apporte donc une valeur ajoutée au projet. La fondation Krita, propriétaire de la marque, se définit comme partisan du développement de logiciels graphiques gratuits et open source et fonde son image de marque sur ce principe. Ceci attire de nombreux utilisateurs qui voit ce principe d’open source comme un label de qualité et vont alors accorder leur confiance au projet. Cette réputation est une ressource très importante puisqu’elle agit comme un gage de qualité du point de vue des utilisateurs, permettant ainsi d’accroitre leur nombre et par conséquent la réputation du projet. Les dons ainsi que le nombre de contributions augmentent au fur et à mesure que le logiciel est utilisé et que la communauté s’agrandit, ce qui renforce la qualité du logiciel. On a ici alors un cercle vertueux se basant sur la confiance mutuelle des utilisateurs et des responsables du projet.

De plus, le soutien du projet KDE renforce d’autant plus l’image de marque du logiciel car celle-ci récupère la réputation due au développement de logiciels gratuits et open sources du projet initial [2].

Le logiciel Krita est distribué sous une licence GNU GPL v3 (General Public Licence version 3) [3]. Cette licence garantit la liberté d’utilisation du logiciel sans condition, tout en assurant sa qualité de code open-source en protégeant les auteurs et le projet [34]. Elle assure une protection légale pour le projet et constitue une ressource juridique très importante pour le projet. La licence est disponible sur le site web dans un onglet dédié et est facilement accessible afin que toutes les parties puissent prendre connaissance. Elle est également disponible dans un fichier du code source, conformément aux consignes de la GNU GPL afin de valider la licence au niveau juridique [70].

Krita possède donc des domaines clés, dans lesquels la fondation et la communauté s’investissent, qui permettent de répondre aux besoins grandissant des utilisateurs.

Partenaires clés

Afin de soutenir ses activités, Krita peut s’appuyer sur l’aide de partenaires précieux.

Dans un premier temps, la fondation KDE est le premier partenaire de Krita. En effet, fondée en 1996 par Matthias Ettrich, le principal projet de cette communauté est le développement d’un environnement de bureau pour UNIX nommé Plasma, fourni avec un ensemble complet de différents logiciels dont Krita fait partie. [41]

La communauté KDE est donc à l’origine du projet et reste à ce jour à sa tête.[3] Tous les contributeurs du logiciel sont des membres de la communauté KDE. Les contributeurs du projet ont donc une expertise assez importante concernant le développement de logiciels open-source [41]. Cela permet donc à Krita de renvoyer une image plus rassurante et professionnelle mais ce partenariat profite aussi à KDE car il permet d’étendre la visibilité de KDE et de compléter son projet plasma.

Ensuite, concernant le développement du logiciel Krita, celui-ci utilise le Framework Qt dont il est très dépendant. Cette forte dépendance à Qt peut être problématique car si Qt n’était plus maintenu, alors Krita se retrouverait en grande difficulté et devrait revoir sa technologie. Cependant, Qt est aujourd’hui une très grande entreprise reconnue et présente mondialement dans des secteurs divers, donc le risque que Qt ne soit plus maintenu semble aujourd’hui assez faible [42].

L’un des principaux avantages de Qt est de proposer les fonctionnalités d’OpenGL au travers de PaintGL qui sont ensuite implémentées par les commandes KisOpenGL [43]. Cela permet à Krita de proposer une plus grande rapidité d’affichage du rendu 2D ou 3D dans le logiciel [44].

De son côté, Qt gagne en visibilité et donc en potentiel contributeurs sur le projet. De plus, Krita a tout intérêt à le promouvoir afin de maintenir son développement.

Pour continuer, Krita possède aussi des partenariats qui aident la Fondation d’un point de vue financier. En effet, en 2019, Epic Games à fait un don de $25 000 à la fondation Krita [45] afin de permettre à Krita un développement plus durable. Cela est en effet bénéfique pour la fondation car cela lui a permis de booster le projet et lui donner de la visibilité. Mais cet investissement n’est pas sans intérêt. En effet, Krita se trouve actuellement disponible sur l’Epic Store [46] au prix de 7.99€ or Epic Games prend une commission qui en 2018 était limitée à 12% [47]. Par conséquent, ce partenariat permet à Krita de continuer à se développer et gagner en popularité ce qui profite aussi à Epic car les ventes de Krita sur leur plateforme leur permettent de rentabiliser leur investissement.

Cet investissement fait partie d’un programme lancé par Epic Games, l’Epic MegaGrants. Ce programme consiste à financer des développeurs de Jeux vidéo, des entreprises ou des projets open-sources développant le milieu du graphisme. [65]

En effet, Epic a développé UnrealEngines, un projet proposant l’environnement de création 3D décrit comme le plus complet existant. [80] Ainsi, Epic soutien des logiciels libre comme Blender ou Krita pour rendre leurs développement plus stables et durables afin de pouvoir continuer à utiliser leurs technologies et leur service pour développer et exploiter au maximum de ses fonctionnalités UnrealEngines. De plus, contribuer au logiciel sous forme de don permet de booster la dynamique du projet sur un court instant, tout en étant moins chère que de payer un développeur à temps plein. Le prix offert par Epic permet de stimuler la communauté open-source et encourage le développement de logiciels tout en étant en retrait sur leur gestion.

Par conséquent, Krita possède de nombreuses aides pour réaliser ses activités principales grâce aux partenariats qui profitent à chaque membre.

Fondation

En 2012, la fondation Krita est créée par la communauté du projet. Une fondation se définit comme une personne morale de droit privé à but non lucratif pour accomplir une œuvre d’intérêt général [66]. Aujourd’hui, Halla Rempt dirige la fondation et est chargée de la gestion du projet [67]. La fondation est aujourd’hui responsable de l’organisation du projet et prends les principales décisions. La fondation se donne les objectifs suivants :

Soutenir le développement de logiciels graphiques libres, en particulier Krita.
Fournir de nombreux services aux développeurs et aux utilisateurs de Krita, comme la documentation du logiciel par exemple ou encore la mise en place d’un forum.
Fournir aux créateurs et artistes tous les besoins logiciels pour faire de la peinture numérique [40].

La fondation permet de soutenir de façon pérenne le développement du logiciel et lui donne une certaine indépendance vis-à-vis du projet KDE dans lequel ce logiciel s’insère. En effet, la création de la fondation permet au projet Krita de survivre malgré ce qu’il peut arriver au projet KDE. Si un jour le projet KDE s’effondre, alors Krita sera toujours potentiellement maintenu grâce au soutien de la fondation et à tous les avantages que cela apporte.

La création de la fondation permet également de formaliser l’organisation du projet et regroupe toutes les tâches administratives sous une même entité. Par exemple, les dons sont récoltés et redistribués par la fondation Krita [40], ce qui permet de redistribuer les dons de manière optimale en fonction des besoins du logiciel. Ceux-ci sont également défiscalisés grâce au statut de la fondation. La fondation embauche ainsi 5 développeurs à temps plein dans le but d’assurer la maintenance nécessaire aux fonctionnalités de Krita. Cela a pour avantages de sécuriser le projet et de le rendre plus professionnel et donc plus crédible face à une clientèle plus technique [53].

Cela permet également de centraliser les services fournis tel que la documentation, le site web, le forum… La fondation fournit également le matériel nécessaire pour pouvoir tester pleinement les fonctionnalités du logiciel (les tablettes graphiques par exemple). Elle finance aussi les frais associés aux différents sprints organisés pour le développement du logiciel [40]. La fondation met alors en place des moyens pour stimuler la communauté, la rendre active et apporte un cadre de collaboration adapté, ce qui permet de faire vivre le logiciel et de le développer.

Ainsi, la gouvernance du projet se fait par la communauté, c’est-à-dire par les personnes développant le logiciel ainsi que les utilisateurs, avec une équipe cœur pour prendre les décisions les plus importantes du projet et avec une écoute et un dialogue avec la communauté. Ils sont appuyés par la communauté d’un autre projet d’envergure qui est KDE. Cette forme de gouvernance par la communauté facilite le travail en collaboration et l’interaction avec les utilisateurs, notamment grâce aux forums, chats de discussions, mailing list mis en place [67].

La communauté de Krita étant assez ancienne, elle a formalisé son organisation au moyen de la création d’une fondation qui permet de centraliser les tâches administratives tel que les déclarations fiscales par exemple, de s’occuper de la communication, de gérer les dons et de s’assurer une certaine indépendance au projet KDE. En effet, bien qu’à l’origine le logiciel faisait partie de KDE, aujourd’hui la fondation Krita en gère légalement le développement. Cela permet de s’assurer un développement en accord avec toutes les parties, augmentant ainsi les opportunités du projet et en réduisant les risques.

Flux de coûts et revenus financiers

a) Coûts de la fondation

Pour répondre aux besoins des utilisateurs, la fondation Krita se voit confrontée à certains coûts.

Tout d’abord, afin de permettre les contributions de la communauté, il faut pouvoir mettre à disposition le code source du logiciel et gérer les dépôts. Cela, Krita se fait grâce à un hébergement chez GitLab. En effet, depuis que KDE a migré vers GitLab [48], Krita doit payer l’hébergement de son code chez celui-ci. Or bien que pour un particulier, cela soit gratuit, les tarifs varient entre $19 et $99 par mois et par utilisateurs [49]. Nous n’avons pas trouvé la formule utilisée par Krita sachant en plus que KDE possède un partenariat avec GitLab [48] donc il se peut que les prix d’hébergement soient réduits pour Krita.

Afin de permettre aux utilisateurs de télécharger Krita et de chercher facilement des informations, Krita doit héberger un site Web. Ceci a un prix mais étant donné que celui-ci est hébergé par KDE [50], nous n’avons pas pu trouver le coût de son hébergement.

Enfin, comme nous l’avons vu précédemment, la fondation Krita parraine 5 développeurs. Ainsi, cela revient à un flux plus de 15 000€ par mois consacrés aux développeurs cœur car la fondation leur fournit également l’environnement de travail nécessaire et paye les éventuels déplacements [40].

De plus, elle a parrainé au cours de l’année quelques développeurs en plus pour travailler sur des tâches spécifiques afin d’utiliser leurs connaissances techniques [51]. En effet, les technologies utilisées par Krita sont difficiles à prendre en main pour un développeur amateur, le coût d’entrée à la contribution est donc élevé, ce qui peut constituer une faiblesse du projet. C’est aussi pour cela que la création de documentation et d’information constitue une activité clé pour la fondation.

b) Revenus de la fondation

Mais tous ces coûts étants financés par la fondation, celle-ci possède nécessairement des revenus.

Cela commence par les utilisateurs qui peuvent, s’ils le souhaitent, faire des dons. Le système de donation se décompose en deux systèmes. Le premier consiste en des donations unitaires du montant choisis par le donateur [52]. Le second est une source plus fiable et donc quantifiée par Krita, il s’agit d’abonnements mensuels avec des montants prédéfinis [53]. Ces abonnements permettent actuellement de récolter pour la fondation un total de 4 235€ sur ce mois.

Afin de rendre ces dons mensuels plus attractifs, Krita les classe selon des paliers offrant plus ou moins de visibilité aux donateurs en fonction du montant donné [53].

Ensuite, la seconde méthode pour générer des revenus à la fondation est la vente de Krita sur les plateformes partenaires qui sont l’Epic Store [46], Windows Store [54] et Steam [55]. La plus grande partie de ces ventes revient à Krita mais en accord avec le partenariat, une commission est reversée aux plateformes allant de 12% pour l’Epic Store à 30% pour Steam [47]

Enfin, les derniers flux de revenus proviennent de marques sponsors qui donnent des fonds à Krita tel que l’a fait Epic Games, GameChuck, FossHub, ASIFA-Hollywood, Agile Coach et XOIO [56].

Ainsi, les revenus de la fondation Krita reposent essentiellement sur des dons de sa communauté. Il est donc nécessaire pour Krita de la développer et surtout de l’impliquer car ces revenus servent à financer directement les services qui permettent de développer les fonctionnalités recherchées par les utilisateurs, c’est-à-dire la communauté de Krita.

Pérennité du projet

La fondation constitue un pilier central dans le développement du projet Krita. Elle incite à la contribution en renvoyant une image stable et pérenne du logiciel notamment par une communication importante et la mise en place de moyens de communications directs avec les développeurs et la communauté par le biais de forum ou de messagerie instantanée. Un utilisateur va ainsi être motivé à contribuer, tout d’abord afin de garantir le maintien et les mises à jour du logiciel mais aussi afin de développer des outils répondant à ses besoins spécifiques. Ce procédé est d’autant plus important, que l’outil peut être utilisé par des professionnels. Ce rapprochement de la communauté permet aux nouveaux contributeurs de s’intégrer facilement et donner l’envie de s’investir. De plus, le développement de Krita permet de donner de meilleurs outils pour exploiter au mieux d’autres logiciels a priori sans relation tel que UnrealEngine par exemple. C’est pourquoi des entreprises tel que Epic investissent dans Krita, afin de booster la dynamique du projet et de profiter des fonctionnalités du logiciel. Ils ont un intérêt à ce que le logiciel perdure car c’est une alternative fonctionnelle et peu coûteuse.

Cependant, si la fondation Krita venait à disparaître ou n’était plus financée, le projet continuerait à vivre grâce au soutien de KDE qui porte encore aujourd’hui le projet. Cette double sécurité avec le soutien de KDE et la mise en place d’une fondation garantit la pérennisation du projet.

Conclusion :

Pour conclure, on peut dire que le projet Krita est un projet en plein développement et en pleine expansion avec la sortie du logiciel sur Android et le déploiement de la version 5.0, ainsi que par le nombre d’utilisateurs croissant. Krita apporte une nouvelle solution de logiciel de dessin numérique open-source et gratuite dans un marché dominé par les logiciels propriétaires tel que Photoshop. Dans le monde du logiciel libre, Krita vient concurrencer Gimp en visant une clientèle large de personne ayant un besoin d’outils de dessin numérique ou d’animation, qu’elle soit amateure ou professionnelle et en particulier, une clientèle jeune voire étudiante.

Pour animer et développer le projet, Krita dispose de nombreuses ressources clefs tel que la fondation qui permet de centraliser et organiser les tâches du projet. Les contributeurs ainsi que les sponsors apportent un soutien nécessaire au développement de l’application qu’il soit financier ou technique avec l’ajout ou la correction de bug, la traduction etc… Le soutien de KDE dans le développement de Krita est un atout considérable puisqu’il apporte des compétences dans le domaine du développement du logiciel libre, une communauté, ainsi qu’une image de marque open-source très apprécié par la communauté du logiciel libre.

Le projet dispose en plus de ces ressources clefs d’autres ressources communes à d’autres projets mais nécessaire tel que le développement d’un serveur Git ou encore l’utilisation de logiciel tel que Bugzilla pour répertorier les bugs.

Ces ressources permettent d’organiser les tâches nécessaires à la bonne réalisation du projet et à son développement. On pense notamment à l’organisation des contributions apportés au code source qui est possible grâce au git. La communication sur l’état d’avancement du projet est un point crucial puisqu’il permet d’organiser le travail et de définir les priorités. La mise en place de canaux de discussions tel qu’une mailing liste ou des forums permet cette activité. La fondation se doit également de stimuler la communauté afin que le logiciel soit utilisé d’une part et que la dynamique du projet ne s’essouffle pas.

La réalisation de toutes ces tâches permet d’une part de créer de la valeur puisqu’on produit des résultats, que ce soit du code, des corrections de bugs, le maintien du logiciel, le développement de l’image de marque… Cela permet de proposer une valeur au projet en fournissant une solution logicielle de dessin numérique mais ainsi que de nombreux autres services tels que de la documentation fournie sur l’utilisation du logiciel. La mise en place d’un forum permettant de regrouper et de rejoindre facilement la communauté autour du logiciel constitue une valeur ajoutée puisqu’elle permet de se distinguer de ses concurrents.

Cette valeur du projet permet de populariser le logiciel et va par conséquent attirer des utilisateurs métiers et des contributeurs qui à leur tour vont contribuer au projet créant ainsi de la valeur au projet. On peut citer notamment l’ajout d’add-ons par la communauté afin d’enrichir le logiciel mais aussi les dons des particuliers ou des entreprises ou encore les contributions. Krita compte sur ce cercle vertueux afin de se bâtir une réputation de logiciel professionnel, destiné à tous ceux ayant un besoin de logiciel de dessin numérique.

Afin de protéger l’organisation et le développement du projet, Krita compte sur de nombreuses ressources législatives tel que l’utilisation d’une marque déposée par la fondation permettant de donner un propriétaire au projet et empêche l’accaparation du projet par une personne ou une entreprise tierce. L’application de licences dites « libres » avec un copyleft fort permettent d’une part de s’assurer de la bonne utilisation du logiciel sans risque pour la fondation, d’autre part de protéger l’utilisateur en lui octroyant des droits, notamment sur ce qu’il peut créer avec le logiciel. Cela encourage également la contribution puisque toutes modifications se doit d’être sous la même licence ou une plus permissive, ce qui permet de développer le logiciel tout en maintenant la philosophie dans lequel le logiciel a été créée. La marque et les licences jouent le rôle de garantie légale et de protection pour la fondation qui a la charge du projet.

Tout ce procédé peut être résumé à la figure 4.

Figure 4: Schéma bilan du fonctionnement du projet Krita

Le projet ne propose que très peu de services annexes payants et a pour seul revenu financier les dons. Ceci est une faiblesse du projet puisque les dons ne sont pas une ressource fiable dans le temps et le coût d’embauche de développeurs à temps plein par la fondation est élevé. De plus, aucune entreprise ne semble se démarquer par sa contribution technique au logiciel, ce qui peut être expliqué par l’histoire du marché qui a longtemps été dominé par les logiciels propriétaires. C’est pourquoi Krita compte comme ressource la plus importante son image de marque et sa réputation afin d’attirer les utilisateurs et par extension, les contributeurs et donateurs afin de continuer à maintenir et développer le projet.

Références :

[1] https://conceptartempire.com/digital-painting/ (définition et utilisation du digital painting) (lu le 12/12/2021)

[2] https://kde.org/community/whatiskde/ (Site communauté KDE) (lu le 12/12/2021)

[3] https://krita.org/en/about/history/ (histoire de Krita) (lu le 12/12/2021)

[4] https://docs.krita.org/en/contributors_manual/krita_manual_readme.html#general-philosophy (Philosophie générale des contributions Krita) (lu le 12/12/2021)

[5] https://www.photovore.fr/comment-choisir-le-bon-logiciel-de-retouche-de-photo%E2%80%89/ (Choix des logiciels de retouche) (lu le 12/12/2021)

[6] https://codes-sources.commentcamarche.net/faq/1271-le-design-des-applications-concevoir-des-interfaces-efficaces-et-vendeuses#pourquoi-sont-elles-si-importantes (Conseils interface) (lu le 12/12/2021)

[7] https://www.youtube.com/c/KritaOrgPainting/featured (YouTube Krita) (lu le 12/12/2021)

[8] https://daviesmediadesign.com/fr/gimp-vs-photoshop-une-version-compl%C3%A8te-de-l%27article-de-comparaison/ (comparaison Gimp Photoshop) (lu le 12/12/2021)

[9] https://helpx.adobe.com/fr/photoshop/how-to/selection-tools-basics.html (outil de sélection Photoshop) (lu le 12/12/2021)

[10] https://helpx.adobe.com/fr/photoshop/how-to/ps-layers-basics.html (outil calque Photoshop) (lu le 12/12/2021)

[11] https://helpx.adobe.com/fr/photoshop/using/color-settings.html (Gestion des couleurs Photoshop) (lu le 12/12/2021)

[12] https://designspartan.com/info_generale/guide-du-digital-painting-1-avant-de-commencer/ (Guide de la peinture digitale) (lu le 12/12/2021)

[13] https://krita.org/en (Site de krita) (lu le 29/10/2021)

[14] https://rigorousthemes.com/blog/krita-vs-photoshop-which-is-better/ (comparaison Krita-Photoshop) (lu le 12/12/2021)

[15] https://fr.wiktionary.org/wiki/photoshoper (wiktionnaire photoshoper) (lu le 12/12/2021)

[16] https://painttool-sai.fr.softonic.com/ (Site Paint Tool Sai) (lu le 12/12/2021)

[17] https://fr.wikipedia.org/wiki/OpenGL (Wikipédia sur OpenGL) (lu le 12/12/2021)

[18] https://www.futura-sciences.com/tech/definitions/informatique-hdr-17001/ (Description de la technologie HDR) (lu le 12/12/2021)

[19] https://en.wikipedia.org/wiki/CMYK_color_model (Wikipédia sur le format CMYK) (lu le 12/12/2021)

[20] https://fr.wikipedia.org/wiki/Adobe_Lightroom_Classic_CC (Wikipédia sur Lightroom) (lu le 12/12/2021)

[21] https://fr.wikipedia.org/wiki/Multiple-image_Network_Graphics (Wikipédia sur le format MNG) (lu le 12/12/2021)

[22] http://www.systemax.jp/en/sai/ (Description Paint Tool Sai) (lu le 12/12/2021)

[23] https://krita.org/en/features/highlights/ (fonctionnalités Krita) (lu le 12/12/2021)

[24] https://conceptartempire.com/digital-painting/ (Description du digital painting) (lu le 12/12/2021)

[25] https://kde.org/fr/plasma-desktop/ (Plasma par KDE) (lu le 12/12/2021)

[26] https://docs.krita.org/en/user_manual/python_scripting/introduction_to_python_scripting.html (documentation sur L’API python) (lu le 12/12/2021)

[27] https://docs.krita.org/fr/reference_manual/brushes/brush_engines/bristle_engine.html (générateur de brosses) (lu le 12/12/2021)

[28] https://krita.org/en/features/highlights/ (fonctionnalités Krita) (lu le 12/12/2021)

[29] https://docs.krita.org/en/index.html (Guide de départ Krita) (lu le 12/12/2021)

[30] https://docs.krita.org/en/general_concepts.html#general-concepts (tutoriels sur la peinture digitale) (lu le 12/12/2021)

[31] https://www.reddit.com/r/krita/ (Reddit Krita) (lu le 12/12/2021)

[32] https://www.reddit.com/r/GIMP/ (Reddit Gimp) (lu le 12/12/2021)

[33] https://www.reddit.com/r/photoshop/ (Reddit Photoshop) (lu le 12/12/2021)

[34] https://krita-artists.org/ (Forum Krita-artists) (lu le 12/12/2021)

[35] https://trends.google.fr/trends/explore?q=Krita,Photoshop,Gimp (analyse google trends) (lu le 12/12/2021)

[36] https://docs.krita.org/en/untranslatable_pages/intro_hacking_krita.html (Contribuer à Krita) (lu le 13/12/2021)

[37] https://invent.kde.org/graphics/krita (dépôt GitLab de Krita) (lu le 13/12/2021)

[38] https://bugs.kde.org/describecomponents.cgi?product=krita (tracker de bugs) (lu le 13/12/2021)

[39] https://krita.org/en/about/krita-releases-overview/ (historique des mises à jour Krita) (lu le 13/12/2021)

[40] https://krita.org/en/about/krita-foundation/ (Fondation Krita) (lu le 13/12/2021)

[41] https://kde.org/fr/ (site de KDE) (lu le 13/12/2021)

[42] https://www.qt.io/ (Site Qt) (lu le 13/12/2021)

[43] https://community.kde.org/Krita/OpenGL (implémentation OpenGL) (lu le 13/12/2021)

[44] https://fr.wikipedia.org/wiki/OpenGL (Wikipédia OpenGL) (lu le 13/12/2021)

[45] https://linuxreviews.org/Krita_Gets_$25,000_From_Epic_Games (Don Epic Games) (lu le 13/12/2021)

[46] https://www.epicgames.com/store/fr/p/krita (Epic Store Krita) (lu le 13/12/2021)

[47] https://www.comptoir-hardware.com/actus/jeux-video/37788-epic-games-store-versus-steam-et-les-autres-des-2019.html (Commission d’Epic Games) (lu le 13/12/2021)

[48] https://about.gitlab.com/blog/2020/06/29/welcome-kde/?ref=hvper.com (KDE et GitLab) (lu le 13/12/2021)

[49] https://about.gitlab.com/pricing/ (Prix GitLab) (lu le 13/12/2021)

[50] https://krita.org/en/about/website/ (mentions site Krita) (lu le 13/12/2021)

[51] https://fund.krita.org/grants/ (sponsorisation de Krita) (lu le 13/12/2021)

[52] https://krita.org/en/support-us/donations/ (page web donations du site Krita Krita) (lu le 13/12/2021)

[53] https://fund.krita.org/ (Site donation Krita) (lu le 13/12/2021)

[54] https://www.microsoft.com/en-us/p/krita/9n6x57zgrw96?activetab=pivot:overviewtab (Microsoft Store) (lu le 13/12/2021)

[55] https://store.steampowered.com/app/280680/Krita/ (Steam Store) (lu le 13/12/2021)

[56] https://krita.org/en/support-us/sponsors/ (Sponsors Krita) (lu le 13/12/2021)

[57] https://www.frandroid.com/guide-dachat/705435_guide-dachat-quelle-tablette-graphique-choisir-en-2020 (guide choix d’un tablette graphique) (lu le 13/12/2021)

[58] https://docs.krita.org/fr/general_concepts.html (tutoriels dessin) (lu le 13/12/2021)

[59] https://docs.krita.org/fr/user_manual/introduction_from_other_software.html (documentation d’autres logiciel Krita) (lu le 13/12/2021)

[60] https://www.reddit.com/r/krita/comments/mn6v7m/best_file_type_when_working_between_krita_and_gimp/ (fichiers ouvrables dans Krita) (lu le 13/12/2021)

[61] https://krita.org/en/item/krita-in-2020/ (Krita 2020) (lu le 13/12/2021)

[62] https://docs.google.com/document/d/1IfTXHzLRWcHnufAqanRv9bFtyyjj2aFOMgaiqj5e76g/edit (meeting 13/09/2021) (lu le 13/12/2021)

[63] https://www.davidrevoy.com/ (site David Roy) (lu le 13/12/2021)

[64] https://krita.org/en/about/license/ (Licence Krita) (lu le 13/12/2021)

[65] https://www.unrealengine.com/en-US/megagrants (Mega Grants) (lu le 13/12/2021)

[66] https://fr.wikipedia.org/wiki/Fondation_(institution) (Wikipédia : Fondation) (lu le 13/12/2021)

[67] https://docs.krita.org/en/contributors_manual/community.html (Contributeurs Krita) (lu le 13/12/2021)

[68] https://docs.krita.org/fr/KritaFAQ.html#who-owns-krita (Appartenance Krita) (lu le 13/12/2021)

[69] https://www.inpi.fr/fr (INPI) (lu le 13/12/2021)

[70] https://www.gnu.org/licenses/gpl-howto.html (Licences GNU) (lu le 13/12/2021)

[71] https://fr.wikipedia.org/wiki/Copyleft (Wikipédia Copy Left) (lu le 13/12/2021)

[72] https://qastack.fr/programming/41460/what-are-the-differences-between-gpl-v2-and-gpl-v3-licenses (différence en GPL2 et GPL3) (lu le 13/12/2021)

[73] https://www.ifross.org/en/what-difference-between-gplv2-and-gplv3 (différence en GPL2 et GPL3) (lu le 13/12/2021)

[74] https://docs.krita.org/en/contributors_manual/krita_manual_readme.html (Manuel des contributeurs) (lu le 13/12/2021)

[75] https://kde.org/code-of-conduct/ (code de conduite KDE) (lu le 13/12/2021)

[76] https://krita.org/en/item/krita-trademark-policy/ (Licence sur la marque) (lu le 13/12/2021)

[77] https://krita-artists.org/faq (faq forum Krita) (lu le 13/12/2021)

[78] https://creativecommons.org/licenses/by-sa/4.0/ (licence CC by sa 4.0) (lu le 13/12/2021)

[79] https://docs.krita.org/fr/contributors_manual/krita_manual_conventions.html#krita-markup-conventions (manuel contribution documentation Krita) (lu le 24/12/2021)

[80] https://www.unrealengine.com/en-US/unreal (Site UnrealEngine) (lu le 17/12/2021)

Annexes :

Figure 6 : Business model canvas de Krita

Figure 7: Interface du logiciel (image tirée de Krita)

Figure 8: Liste des formats de fichiers pouvant être exportés par Krita (image du logiciel après avoir cliqué sur exporter)

Figure 9: Liste des formats de fichiers ouverts par Krita (image du logiciel après avoir cliqué sur ouvrir)

Figure 10: Personnalisation des raccourcis et sets disponibles de Krita (capture d’écran du logiciel)

Étude du modèle économique de la plate-forme StudyAdvisor

Figure 0: Logo de l’entreprise StudyAdvisor

Introduction

Le 16 juillet 2018 la réforme du baccalauréat a été signée et a été appliquée dès la rentrée 2019. Ce changement est encore un casse-tête pour les familles qui doivent aider leurs enfants à choisir des matières dès la deuxième année de Lycée. Favorisant un système de spécialités, les élèves accèdent à un éventail plus grand de formation. Cependant, cette diversité rend plus difficile pour ces élèves de s’y retrouver dans l’orientation scolaire. Comme le souligne Médiapart dans son article[1], la réforme prévoyait aussi d’intégrer plus d’heures dédiés à l’orientation durant du parcours de formation. Mais une enquête réalisée par le Cnesco[2] démontre que l’orientation des 18-25 ans en France n’est pas suffisante : en effet, 48% des jeunes déclarent ne pas bien avoir été suffisamment accompagnés par leur établissement. L’orientation a constitué une source de stress pour 2/3 d’entre eux, près d’un jeune sur cinq estime qu’il n’a pas eu le choix de son orientation.

C’est alors que se positionne l’entreprise StudyAdvisor, qui permet de mettre en relation des lycéens ou des personnes souhaitant trouver une orientation et des étudiants afin qu’ils puissent discuter ensemble des possibilités de parcours. StudyAdvisor s’intègre dans l’écosystème de l’économie collaborative, économie de partage ou de pair à pair qui est défini comme « une organisation de la collaboration et des échanges, marchands ou non, entre individus, avec le souci de partager des ressources, dans un contexte institutionnel assez peu contraignant ». (Dang N’Guyen, 2016). Selon la direction générale de la concurrence, de la consommation et de la répression des fraudes c’est « une économie qui repose sur le partage ou l’échange entre particuliers de biens, de services, ou de connaissances, avec échange monétaire ou sans échange monétaire, par l’intermédiaire d’une plateforme numérique de mise en relation ». Aujourd’hui le stade de phénomène a été dépassé et touche tous les secteurs de l’économie dont celui de l’orientation, que nous allons étudier aujourd’hui.

Pour étudier le business model de l’entreprise nous allons nous appuyer tout du long de notre réflexion sur le business model Canvas[3].

Dans une première partie, nous proposerons une analyse externe concernant le marché de l’orientation scolaire et son écosystème afin d’analyser l’offre de StudyAdvisor au sein de son environnement concurrentiel. Dans une dernière partie, notre analyse portera sur l’étude de la structure du business model de l’entreprise.

I- Les particularités du marché de l’orientation scolaire.

A) L’orientation scolaire, un marché en forte croissance

Les résultats d’une étude menée par le CNESCO2 montrent que parmi les 52% d’étudiants de première année d’université́ qui ne poursuivent pas en deuxième année, 30% redoublent, 16% se réorientent et 6% abandonnent leurs études. Cela représente un potentiel important d’étudiants nécessitant des conseils en orientation. À cela s’ajoutent 1 619 600 lycéens[4]. Néanmoins, comme l’explique Théo R. & Mathurin S pour Mediapart1 la France compte 1 conseiller d’orientation pour 1500 élèves dans le secondaire, contre 1 pour 1300 en 2002. De plus, en 20 ans, les conseillers d’orientation sont de moins en moins nombreux et se retrouvent donc à devoir conseiller de plus en plus d’élèves, ayant pour conséquence direct un manque de personnalisation et des étudiants. De manière générale, l’État à une place qui se réduit sur le marché de l’orientation scolaire. Les familles sont donc encouragées à se tourner vers d’autres solutions. De plus en plus d’entreprises se positionnent sur ce marché, néanmoins avec des prix élevés pouvant aller de 250 à 600 euros en moyenne. Tout le monde ne pourra pas avoir accès aux mêmes prestations. D’après l’ouvrage de la sociologue Anne-Claudine Oller : Coaching scolaire : un marché de la réalisation de soi, le chiffre d’affaires du marché de l’orientation a augmenté de 63% entre 2015 et 2020.

B) Analyse du macro-environnement

Le macro-environnement désigne l’environnement général au sein duquel une entreprise évolue. Il s’agit des caractéristiques générales de l’économie et de la société qui peuvent influencer une entreprise. Pour étudier le macroenvironnement, nous utiliserons le modèle PESTEL[5]. Ce modèle est né dans les années 1970 avec les modèles de gestion de portefeuille d’activité (Matrice BCG, McKinsey) dont elle était une étape préalable. L’analyse PESTEL est utile pour comprendre l’environnement macro-économique et concurrentiel d’une entreprise, et permet également de détecter les potentielles menaces et opportunités que pourrait rencontrer une entreprise, ici StudyAdvisor.

	OPPORTUNITÉS	MENACES	Source
Environnement politique et Légal	L’État se désengage de son rôle et laisse une place de plus en plus importante aux entreprises privées. Choix de l’orientation dès le mois de mars sur la nouvelle plateforme « Parcoursup » La loi « Orientation et réussite des étudiants » (ORE), promulguée en mars 2018, visant à réduire le taux d’échec en première année de fac en permettant à chaque université de fixer des prérequis pour choisir les étudiants.	Politique sociale qui vise à restreindre l’accès aux études supérieures afin de rééquilibrer la valeur apportée par les diplômes. Loi sur les Règlement Général sur la Protection des données (RGPD) : les entreprises doivent veiller à obtenir le consentement de leurs utilisateurs quant au traitement de leurs données, et avoir un traitement proportionné de celle-ci. Nouvelles lois sur l’accès aux études supérieures. Ces dernières étant devenues sélectives, les élèves sont amenés à se renseigner plusieurs fois sur les bonnes formations, les parcours qui leurs correspondent ainsi que les opportunités professionnelles qui en découlent.	https://www.parcoursup.fr/ https://www.cnil.fr/fr/comprendre-le-rgpd https://tel.archives-ouvertes.fr/tel-01143685/document https://www.lesechos.fr/politique-societe/societe/parcoursup-acces-a-luniversite-ce-que-change-la-loi-ore-139646
Environnement économique	Avec un taux de chômage relativement élevé, entre 8,5% et 8,6% en 2021 et 25% chez les jeunes, les lycéens et étudiants se voient incités à poursuivre leurs études pour être toujours plus qualifiés et s’assurer par la suite un emploi. Le contexte économique actuel induit indirectement la recherche d’une meilleure position sociale et professionnelle, ce qui favorise la poursuite d’études supérieures. Dans un contexte économique incertain, les Français épargnent toujours plus. En 2019, les Français auraient épargné presque 15% de leur revenu disponible. Une partie de cette épargne est notamment destinée aux études des enfants. La crise du Covid-19 a accentué ce phénomène.	Les coûts de scolarité et de la vie quotidienne ne cessent d’augmenter. Par exemple, les écoles de commerces ont en moyenne augmenté leurs frais de scolarité de 20% par an. Mais ce phénomène ne touche pas seulement les écoles de commerce.	https://www.insee.fr/fr/statistiques/5346969 https://blogs.mediapart.fr/theo-r-et-mathurin-s/blog/060621/le-nouveau-marche-de-l-orientation-scolaire https://www.letudiant.fr/etudes/ecole-de-commerce/ecoles-de-commerce-des-frais-de-scolarite-qui-ne-cessent-d-augmenter-depuis-5-ans.html https://www.viedesmetiers.com/formation/cout-etudes-superieures-france/
Environnement Socio-culturel	Le taux d’étudiants diplômés de l’enseignement supérieur a augmenté au cours des années. L’INSEE a constaté, de 1990 à 2020, une augmentation de 9% par an, soit de 1,7 million d’étudiants en 1990 à 2,7 millions en 2020 ; Les possibilités de poursuites d’études s’élargissent. Les étudiants ont désormais une meilleure compréhension des filières, de l’enseignement privé et public, ainsi que des poursuites d’étude. Beaucoup d’étudiants au grade de licence souhaitent continuer leurs études pour faire des masters ; Les parcours se complexifient : admissions parallèles, DUETI (Erasmus), VIE, année de césure…	Découragement des lycéens à poursuivre leurs études dans le contexte du covid-19 et de la paupérisation de la société On observe une inquiétude grandissante de la part des étudiants concernant leur avenir professionnel et leur choix d’orientation ;	https://www.insee.fr/fr/statistiques/5346969 http://www.cnesco.fr/wp-content/uploads/2018/12/181211_Cnesco_Orientation_Dossier_synthese.pdf
Environnement technologique	Industrie de service qui s’est largement digitalisée avec une forte dépense en codage et mise en forme des sites afin de rendre les entreprises plus attractives. Technologies en pleine expansion et de plus en plus utilisées par la population française et mondiale. Le taux d’équipement en smartphone est de 98% chez les 18-24 ans. Offre 100% online, développer une application mobile.	Des dépenses importantes en marketing et en système d’information devraient être envisagées. Créer une application mobile nécessite un important investissement financier mais paraît de plus en plus nécessaire afin de toucher cette partie de la population.	https://fr.statista.com/statistiques/505110/taux-de-penetration-du-smartphone-par-age-france/#:~:text=Cette%20statistique%20montre%20le%20taux,ayant%20plus%20de%2070%20ans. https://wsigabs.ch/quel-budget-pour-votre-marketing-digital-en-2022/
Facteurs environnementaux et écologiques	Dépenses dans les énergies vertes concernant les serveurs notamment, démarche de Responsabilité Sociétale des Entreprises (RSE) .

Ainsi, le PESTEL nous permet de constater que ce marché possède de nombreux facteurs qui représentent des opportunités pour les entreprises s’y positionnant. Tout d’abord, d’un point de vue politique et légal, l’Etat se désengage de plus en plus de son rôle d’aider les lycéens à bien choisir leurs orientations. Ce qui permet à de nombreuses entreprises privées de compléter ce devoir d’orientation. À cela il faut ajouter l’augmentation des frais de scolarité des formations. Par conséquent, l’orientation devient de plus en plus un enjeu économique pour de nombreux acteurs. Une autre opportunité mise en avant dans cette analyse est socio-culturel. Le nombre de personnes souhaitant faire des études ne diminue pas bien au contraire il augmente. Les grandes études sont perçues comme un facteur de réussite et sont encouragées. Ainsi, le nombre de personnes à conseiller ne devrait pas diminuer avec le temps et même représenter un marché potentiel en augmentation.

Cependant, l’analyse PESTEL met en avant plusieurs freins à ce marché. En premier lieu, les entreprises doivent pouvoir s’adresser à des jeunes âgés de 18 à 24 ans. De plus, le covid-19 a profondément modifié l’organisation de notre société. L’organisation de grands événements est de plus en plus remise en cause.

Tous ces éléments font de ce marché à la fois un secteur porteur sur le long terme mais aussi singulier par les caractéristiques et les attentes de ces clients. C’est dans ce contexte qu’est née StudyAdvisor en 2016. Une plateforme de mise en relation entre des lycéens ou des personnes souhaitant trouver une orientation et des étudiants afin qu’ils puissent discuter ensemble des possibilités de parcours. Intéressons-nous plus particulièrement à la proposition de valeur de cette entreprise.

II- Segmentation clients et proposition de valeur de StudyAdvisor

A) Segmentation clients

StudyAdvisor dispose de trois types de clients et de propositions de valeurs : c’est alors ce qu’on appelle une plateforme triface : les lycéens ou étudiants souhaitant être conseillés, appelés “piou-pious”, les étudiants qui partagent leurs expériences, qu’on nomme les “Advisor”, et les établissements de formation et les entreprises partenaires qui proposent des offres fonctionnent par affiliation.

Les piou-pious : ils représentent l’ensemble des lycéens soucieux de trouver leur futur établissement d’études supérieures, mais également les étudiants en recherche de poursuite d’études ou de réorientation. StudyAdvisor s’adresse en priorité aux lycéens car la grande majorité des lycéens souhaitent poursuivre leurs études après l’obtention de leur baccalauréat mais nombre d’entre eux ne savent pas quel parcours choisir ni comment intégrer telle école ou telle formation. StudyAdvisor cible aussi les étudiants qui souhaitent se réorienter ou continuer leurs études, par exemple les étudiants en fin de licence qui souhaitent faire un master. En moyenne, les piou-pious sont les jeunes entre 17 et 25 ans plus jeunes que les Advisor. Enfin, les piou-pious sont les seuls clients de la plateforme à pouvoir profiter des services de StudyAdvisor de manière gratuite. Or, « si c’est gratuit c’est que vous êtes le produit ». Nous y reviendrons dans le business model de l’entreprise.

Les Advisor : aujourd’hui au nombre de 54 176[6], ce sont les étudiants inscrits sur la plateforme pour conseiller les piou-pious. Ces étudiants sont en cours de formation ou bien diplômés et peuvent donc, à travers leurs témoignages, apporter des conseils aux piou-pious contre une rémunération de la part de StudyAdvisor. Ils perçoivent 3 ou 5€ selon leur statut sur la plateforme, pour chaque appel avec un pioupiou effectué. N’importe quelle personne issue de la formation peut s’inscrire sur la plateforme. Les Advisor représentent la valeur ajoutée de l’entreprise car par leur statut d’étudiants ou de diplômés, ils sont les mieux placés pour parler de leur formation ou présenter leur école. Ils sont là pour présenter des propos sincères, authentiques, et indépendants, contrairement à des professionnels qui ne seront pas forcément objectifs et qui seront plus là pour ”vendre” l’école à travers un discours bien rodé. Bien que de manière générale un étudiant ait envie de défendre sa formation, le nombre important d’Advisor sur la plateforme fait qu’un étudiant peut facilement contacter plusieurs personnes issues d’école différentes pour une formation similaire.

Les établissements de formation et entreprises partenaires : En 2021, StudyAdvisor dispose de 3005 écoles partenaires, ce qui représente un total de plus de 1755 formations. Ces établissements payent StudyAdvisor pour leur service de mise en relation avec leurs futurs candidats. Parmi ces établissements on peut citer par exemple l’ESME Sudria, l’IAE d’Aix-en-Provence, Vatel, l’EM Normandie. La plupart sont des organismes de formation payants. À titre d’exemple les 6 formations mises en avant sur la page d’accueil de la plateforme sont privées et coûtent plus de 5000€ l’année[7]. Par conséquent, la plateforme est un vivier de potentiel futur étudiant à influencer dans leurs orientations. Quant aux entreprises partenaires qui proposent sur la plateforme des promotions aux étudiants rémunère la plateforme pour chaque nouveau client attiré grâce à ces promotions.

Ainsi, pour chacun de ces segments client, l’entreprise propose une offre de service différent.

B) Proposition de valeur

Afin de déterminer les différentes fonctions proposées par le service de StudyAdvisor pour satisfaire ses différents utilisateurs, nous allons réaliser l’Analyse fonctionnelle de celle-ci.

Type de fonction	Libellé	Critères	Justification Référence
Principale	FP1 : Orienter les Lycéens et les étudiants	-Mettre en relation les lycées avec les bonnes personnes pour répondre à leurs questions – Mettre en relation les lycéens avec les formations	Interview de Leo Sounigo sur BFM Business[8]
Contrainte	FC1 : Motiver les Advisor	-Offrir une rémunération attractive -avoir un délai de paiement raisonnable	Interview de Leo Sounigo sur BFM Business[9]
Principale	FP2 : Mettre en avant des formations auprès d’étudiants indécis sur leur orientation	-Proposer des offres pécuniaires aux organismes de formations pour les mettre en avant.	-Interview de Leo Sounigo sur BFM Business Il explique que le business model de l’entreprise repose sur la rémunération des organismes de formation.
Principale	FP2 : Offrir de la publicité et des affiliations ciblées	-Respecter la réglementation RGPD -Vendre des partenariats avec des marques qui ciblent les jeunes générations.	-Mise en avant de partenariat rémunéré avec Orange Bank, Pumkin, Heetch, Animaute…
Contrainte	FC2 : S’assurer que l’appel de l’Advisor à bien été réalisé	-Avoir une vérification à moindre coût.	-La plateforme indique vérifier scrupuleusement chaque fiche envoyé8 et se réserve le droit de déposer plainte en cas de fraude.

Figure 1: Positionnement de la plate-forme Study Advisor sur le marché des services de conseil en orientation

La caractéristique principale de l’offre de StudyAdvisor est sa gratuité pour les étudiants souhaitant être conseillés dans leur orientation. Cette offre permet à la plateforme d’attirer des étudiants soucieux de faire les bons choix en toute connaissance pour leur parcours scolaire. Néanmoins, pour pouvoir proposer ce service, StudyAdvisor doit motiver les Advisor à s’inscrire sur la plateforme. C’est pourquoi le service est rémunéré entre 3 à 5 euros par appel selon le statut du profil (Premium ou basique). Pour pouvoir être premium et donc être payé 5 euros il faut ouvrir un compte avec Orange Bank, ce qui est un moyen pour StudyAdvisor de trouver d’autres sources de financement. Ce type de rémunération se rapproche du système de pair à pair marchand[10].

La plateforme rassemble de nombreux Advisor, environ 54411 selon l’entreprise. Ce grand nombre de profils permet à StudyAdvisor d’avoir une offre variée. En effet, l’importance de cette audience est un moyen pour la plateforme de proposer une mise en relation plus large et de toucher un public plus large.

Néanmoins, l’offre est peu personnalisée car les Advisor échangent seulement sur leurs expériences, ils n’ont pas de formation en orientation scolaire ce qui permettrait à la plateforme d’offrir une offre plus personnalisée.

Cette analyse correspond à l’offre de la plateforme pour pouvoir attirer des utilisateurs. Néanmoins, le réel produit de l’entreprise est ce vivier de jeunes étudiants qui sont à la recherche d’une orientation. Ce grand nombre d’utilisateur permet à l’entreprise de générer deux sources de revenus. Le premier s’adresse aux organismes de formation qui paient pour pouvoir être présents sur la plateforme, et qui peuvent aussi contacter directement les piou-piou. La deuxième source de revenus provient des nombreuses offres exclusives proposées aux personnes ayant créé un compte sur la plateforme. Ces marques payent la plateforme StudyAdvisor afin de toucher plus efficacement leurs cibles que sont les jeunes générations, une audience qualifiée qui va commencer ou qui est en étude supérieure.

Analysons la proposition de valeur de StudyAdvisor, c’est-à-dire la description des produits/services qu’offre l’entreprise à chacun de ces clients. Pour ce faire nous présenterons le Canevas de proposition de valeur pour chaque utilisateur de la plateforme.

Figure 3 : Canvas de proposition de valeur pour les piou-piou

Figure 4: Canvas de proposition de valeur pour les Advisor

Figure 5 : Canvas de proposition de valeur pour les entreprises et formations partenaires

Les Piou-piou recherchent principalement à utiliser la plateforme afin de pouvoir être mis en relation avec une personne qui a une expertise sur la formation. Leur objectif est de contacter quelqu’un qui n’est pas dans leur réseau à l’origine, et c’est alors que la plateforme leur met à disposition un catalogue de contacts ainsi que de formations. C’est un aspect essentiel de l’effet de réseau de StudyAdvisor[11]. En effet, plus le catalogue est varié, plus les Piou-Piou vont être attirés par l’utilisation de ce service, et donc la plateforme attirera davantage d’Advisor. Ce cercle vertueux est alors la caractéristique fondamentale de l’effet de réseau engendré par la plateforme. De plus, l’augmentation du nombre d’utilisateur permet à l’entreprise de réaliser une économie d’échelle en optimisant les performances de l’algorithme de Matching entre les utilisateurs.

Contrairement aux Piou-Piou, les Advisor réalisent une prestation pour la plateforme en conseillant les lycéens. Ainsi, le facteur principal de l’inscription de ces utilisateurs sur la plateforme réside dans la rémunération de cette prestation comprise entre 3 à 5€ par entretien. Or, c’est une rémunération faible. De plus, afin d’optimiser la visibilité de son profil, il peut réaliser du contenu comme des articles ou des interviews gratuitement. Cela permet à la plateforme de mettre en avant le dynamisme de sa communauté auprès de son dernier utilisateur : les entreprises partenaires.

La troisième proposition de valeur de l’entreprise tient dans ce riche vivier d’étudiants âgés de 18 à 24 ans et de jeunes en quête de la bonne formation. En effet, les entreprises partenaires et les organismes de formation souhaitent atteindre ce segment de population en étant présents sur cette plateforme. Ainsi, en échange d’une rémunération à StudyAdvisor, certaines formations sont mises en avant au travers de publicités ou en étant favorisés dans les résultats de recherches des étudiants. Cette audience qualifiée est très intéressante pour ces entreprises car en faisant de la publicité sur StudyAdvisor, les entreprises sont certaines de toucher leurs cibles qui sont les Piou-Piou.

De manière générale, la start-up propose un service tout à fait inédit et innovant dans le domaine de l’orientation des étudiants. Aujourd’hui, il y a beaucoup de solutions pour l’aide aux devoirs, les cours du soir ou encore les cours en ligne, mais très peu de solutions existent pour guider les élèves et étudiants dans leur orientation scolaire, et ce de manière collaborative. De plus, la plateforme bénéficie de plus en plus d’une communauté engagée, motivée par la rémunération pour les Advisor ainsi que par la gratuité du service pour les Piou-Piou. Ce qui rend de plus en plus difficile l’émergence d’une plateforme identique, proposant des avantages plus conséquents aux Advisor, bien qu’aucun brevet n’ait été déposé par l’entreprise, c’est la nécessité d’avoir recours à une économie de réseaux. La condition de survie de la plateforme réside dans sa capacité à renouveler sa communauté sur le long terme.

Maintenant que nous avons analysé la proposition de valeur de StudyAdvisor, qu’en est-il de son positionnement face à la concurrence.

C) Analyse de la concurrence

Analysons le positionnement de l’entreprise sur son marché en identifiant ses principaux concurrents. StudyAdvisor n’est pas le seul acteur à proposer une expérience d’orientation de manière pair à pair, néanmoins, tous ses concurrents n’interviennent pas au même moment dans les différentes étapes de l’orientation scolaire. En effet, comme l’explique le guide AlphaOmega de l’orientation[12] à destination des élèves de classe de Terminale, l’orientation se décompose en cinq étapes clés. Dans un premier temps, un travail d’introspection et de connaissance de soi sera indispensable afin d’établir un domaine d’étude qui nous intéresse. Cette partie permet de mieux se connaître et d’identifier des types d’études correspondant à ses aspirations. Pour le réaliser plusieurs entreprises peuvent vous aider. C’est le cas de : imaginetonfutur[13], inspire[14] , futurness[15] ou pixis[16]. Puis dans un deuxième temps, un travail de recherche sera nécessaire afin de cibler la formation qui correspond aux attentes. C’est dans cette partie de l’orientation que StudyAdvisor se positionne.

Analysons les principales différences et points communs entre la plateforme et ses concurrents directs.

Intéressons-nous plus particulièrement au positionnement des concurrents directs de la plateforme : les Salons d’orientation, Diplomeo et les conseillers d’orientation.

Les salons de l’orientation : Il existe de nombreux salons dédiés à l’orientation. La plupart se tiennent entre le mois de septembre et le mois de mars. Certains sont assez généralistes et d’autres plus spécialisés, par secteurs ou formations (les Grandes Écoles de Commerce, les études d’art, de la santé…). La majorité de ces salons sont financés par les publicités, les organismes de formation et l’État, permettant aux étudiants et à leurs parents d’accéder à ces salons gratuitement. La crise du coronavirus a digitalisé ces rendez-vous incontournables pour les lycéens souhaitant s’informer sur leur futur. Les principales raisons de la visite des salons d’orientation résident dans la grande concentration des formations. Ainsi, un visiteur pourra se renseigner sur plusieurs formations à la fois au même endroit, optimisant alors son temps et ces déplacements. De plus, il pourra comparer plus facilement les organismes entre eux en posant plus facilement des questions aux différents interlocuteurs. Cependant, ces salons sont connus pour promouvoir un établissement sans apporter de point de vue critique sur la formation, il est donc important d’avoir un sens critique et de s’être au minimum renseigné avant de visiter un salon d’orientation, sinon il est facile de tomber dans certains pièges.

Les conseillers d’orientation : Fonctionnaire de l’Éducation Nationale, le conseiller d’orientation travaille dans un établissement scolaire ou un Centre d’Information et d’Orientation (CIO). Il intervient auprès des jeunes, mais aussi des adultes, pour les informer et les guider dans leurs choix de carrière. Dans les lycées, ils aident les jeunes à prendre les meilleures décisions par rapport à leur profil et leurs appétences. Les postes de conseillers d’orientation proposés par le ministère de l’Éducation nationale sont peu nombreux. Il y aurait environ 5 300 conseillers en exercice en France. Néanmoins, du fait de la baisse du nombre de ces conseillers, il est plus difficile pour un étudiant de les rencontrer. Par conséquent, de plus en plus d’entreprises privées proposent un service similaire mais nécessitant une rémunération beaucoup plus élevée. Tout l’intérêt d’un étudiant en quête de la bonne orientation de se rendre chez un conseiller d’orientation réside dans le rôle d’expert de cette personne. En effet, le conseiller est une personne formée qui va orienter la personne vers le secteur qui lui correspond le mieux. Il pourra apporter des connaissances sur le contenu théorique de ce secteur et les principaux débouchés.

Diplomeo : Site internet dédié aux études supérieures qui regroupe pratiquement l’ensemble de l’offre de formation professionnelle française. Diplomeo fait figure de concurrent direct de StudyAdvisor. En plus de répertorier les différentes formations existantes en France, ce site propose un service d’orientation en ligne. Diplomeo met en avant le fait de pouvoir se renseigner sur plus de 9000 établissements et 46000 formations, et d’avoir orienté 2,5 millions d’étudiants par téléphone[17]. Néanmoins, bien que l’offre puisse être considérée plus personnalisée et plus variée que celle de StudyAdvisor, Diplomeo favorise certaines formations au détriment d’autres. Une personne qui se rend sur Diplomeo aura déjà certaines idées en tête, et utilisera la plateforme pour se renseigner sur une formation bien précise. L’avantage de l’utilisateur réside dans l’accessibilité de l’information.

L’analyse de la concurrence nous a permis de constater que ce marché possède de nombreux acteurs au positionnement distinct. Les concurrents directs[18] constitués de l’ensemble des entreprises proposant un service ou un produit similaire à StudyAdvisor sont différents selon le segment de clientèle dans lequel on se place. Un Piou-Piou qui souhaite se renseigner peut, selon le niveau de maturité de son projet, utiliser la plupart des entreprises présentées précédemment. Néanmoins, les avantages concurrentiels précédemment analysés nous permettent d’expliquer l’utilisation de StudyAdvisor par la recherche de l’expérience que produit un Advisor. Un avantage qui coûte cher à StudyAdvisor mais qui permet à l’entreprise de proposer un service plus varié que ses concurrents directs.

Un organisme de formation va pouvoir se tourner vers des entreprises tel que Diplomeo, les salons ou inspire qui propose des services de mise en avant auprès de leurs utilisateurs.

Les concurrents indirects sont les entreprises qui proposent un produit ou un service différent, mais répondant au même besoin que celui auquel StudyAdvisor cherche à répondre. Pour un Piou-Piou, ce besoin est la détermination du meilleur choix d’orientation. Pour se faire ils peuvent contacter leurs propres réseaux via des applications dédiées tel que LinkedIn ou Facebook. Ces plateformes leur permettraient alors d’être mis en relation avec des personnes ayant choisi une orientation similaire à celle envisagée. De plus, une entreprise comme LinkedIn s’adresse directement à des utilisateurs souhaitant développer leurs réseaux professionnels et donc le cursus scolaire sera mis en avant sur le profil de ces utilisateurs. Ce qui facilitera la recherche des Piou-Piou. De plus, comme le montre l’étude du Cnesco[19] l’enseignant et les parents sont souvent un facteur important dans l’orientation des élèves, représentant respectivement pour 37% et 25% des élèves sondés l’origine de leurs orientations.

Pour les organismes de formations, le besoin auquel répond StudyAdvisor est principalement la nécessité d’atteindre de potentiel étudiant de leurs formations afin de les présenter. Or, afin d’atteindre ces cibles, les organismes de formations peuvent proposer des publicités à des entreprises comme Google ou Facebook. Ils bénéficieront des données personnelles afin de cibler les jeunes de 18 à 24 ans.

Les Advisor quant à eux peuvent obtenir une rémunération pour d’autres services qui serait moins coûteuse en temps. Néanmoins, s’ils utilisent la plateforme afin de mettre en avant leurs profils et leurs expériences, ils peuvent utiliser des réseaux sociaux tel que LinkedIn ou Facebook.

La concurrence indirecte de StudyAdvisor peut avoir un impact le plus important sur son business model. En effet, comme l’explique l’étude du Cnesco, les recherches personnelles (17%) ainsi que les conseillers d’orientation (13%) sont peu à l’origine des choix d’orientation.

Maintenant que nous avons présenté l’entreprise dans son contexte concurrentiel, nous allons déterminer comment StudyAdvisor organise son modèle d’affaires. C’est-à-dire d’après la définition d’Onetti[20] comme la manière dont une entreprise structure ses propres activités en déterminant la cible, le lieu et les modalités de son affaire.

III- Analyse interne de StudyAdvisor

A) Les relations clients

L’entreprise s’adresse à trois segmentations clients différentes. Et pour chacun de ces clients une proposition de valeurs différentes existe. La cible principale de ces utilisateurs est âgée de 15 à 25 ans et souhaite trouver son orientation. Ainsi, pour les attirer sur la plateforme, l’entreprise dispose de plusieurs leviers.

Le premier réside dans la confiance et le sérieux des Advisor. Ces derniers sont rémunérés et se doivent de proposer un service de qualité. De plus, après chaque appel réalisé entre un Advisor et un Piou-Piou, un système de notation est proposé au Piou-Piou afin d’évaluer la qualité de la conversation qu’il aura eu avec l’Advisor. Tous ces éléments permettent d’améliorer la confiance des utilisateurs sur la plateforme. En effet, grâce à ce mécanisme la communauté est informée de la qualité la conversation que vous avez eu avec un Advisor, de sorte que si elle s’est mal passée, le profil de l’Advisor sera moins bien référencé. Plusieurs études ont montré que ce type de notation augmentait la confiance qu’on pouvait avoir en un étranger[21].

De surcroît, les organismes de formation et les entreprises souhaitent obtenir de nouveaux clients grâce à StudyAdvisor. Par conséquent, les relations avec ce type de clients reposent sur la capacité qu’a la plateforme de mettre en avant leurs publicités.

B) Les canaux de distribution

StudyAdvisor propose la mise en relation des Piou-Piou et des Advisor grâce au moteur de recherche, disponible sur son site internet. Ce service étant de plus en plus efficace selon le nombre d’utilisateurs inscrits sur la plateforme, l’entreprise doit, grâce aux réseaux sociaux ou la presse, réussir à créer un effet de réseau.

C) Les partenaires clés

StudyAdvisor dispose de plusieurs types de partenaires clés afin de gagner en crédibilité. On retrouve les entreprises et sponsors susceptibles d’intéresser les étudiants (Heetch, SmartRenting, Kidle …). Ces partenariats permettent à StudyAdvisor de fidéliser ses Advisor ainsi que de les accompagner dans toutes les facettes de leur vie d’étudiants en leur proposant des offres préférentielles sur les produits de ces entreprises partenaires.

Les étudiants représentent quant à eux à la fois des partenaires et des ressources clés primordiales à l’activité de l’entreprise. Ainsi, leurs présences sur la plateforme sont une condition sine qua non à la survie de la plateforme. Par conséquent, StudyAdvisor utilise le levier de la rémunération afin de les attirer et de les retenir.

De plus, StudyAdvisor utilise des associations et institutions publiques comme la Fédération des parents d’élèves, l’Association des Parents d’Elèves (APPEL), les Parents d’Elèves de l’Enseignement Public (PEEP), la CCI de France, BPI France ou la région Ile-de-France afin de gagner en crédibilité aux yeux des utilisateurs de la plateforme. Ces partenaires permettent à l’entreprise de gagner en confiance aux yeux de ces utilisateurs et donc d’en attirer de nouveaux.

D) Les ressources clés

StudyAdvisor fait partie de l’économie collaborative car elle met en relation via une plateforme numérique des donateurs et des receveurs. En ce sens, la principale ressource clé dont elle dispose est ces utilisateurs. On distingue plusieurs types d’utilisateurs. De manière générale les principaux sont les Piou-Piou et Advisor qui sont des jeunes âgés de 15 à 25 ans. L’objectif de la plateforme est de convertir les premiers en Advisor afin qu’ils continuent à faire vivre cette plateforme sur le long terme. De plus, on a les entreprises et organismes de formations qui permettent d’améliorer le contenu de la plateforme et donc de donner plus d’information aux jeunes utilisateurs. Toutes les données générées sur la plateforme sont comprises dans les ressources clés de l’entreprise.

E) Les activités clés

Les activités clés sont les missions les plus importantes qu’une entreprise doit faire pour que son modèle économique fonctionne. Les activités de StudyAdvisor se résument donc dans la mise en relation entre une personne souhaitant se renseigner sur un parcours ou une formation et une personne ayant réalisé ce parcours ou cette formation. Afin de mener à bien cette mission la pertinence des résultats du moteur de recherche de l’entreprise est primordiale. Or, plus la plateforme comprend d’utilisateurs, plus ces performances seront importantes.

De plus, la maintenance et le fonctionnement interne de l’entreprise sont des activités secondaires mais nécessaires à la réalisation de la mission principale de StudyAdvisor. Tout comme la communication externe. Cela représente un levier afin d’attirer de nouveaux utilisateurs et d’améliorer l’effet de réseaux.

F) Le Coût

Malgré le manque d’information relatif à la structure financière de StudyAdvisor, les coûts suivants ont pu être identifiés :

Le coût principal réside dans la rémunération des Advisor. De 3 à 5€ selon son profil cela représente un coût non négligeable pour l’entreprise. Bien que l’on puisse identifier plusieurs leviers afin de diminuer l’impact de ce budget. Tout d’abord, l’entreprise ne paye pas ces Advisor directement mais seulement 1mois à 1mois et demi après la prestation. Cela leur permet de baisser le BFR de l’entreprise. De plus, l’entreprise fixe le prix de ces prestations, par conséquent on observe une diminution de ces prix. À l’origine peu importe le statut des Advisor ils touchaient 5€ par prestation. Enfin, tous les paiements sont réalisés grâce à Pumkin, ce qui permet à l’entreprise de réduire ses coûts de transactions.

Un coût tout aussi important se situe dans les ressources humaines et locales de l’entreprise. En effet, aujourd’hui plus d’une trentaine à travailler dans l’entreprise, le nombre de salariés n’a cessé de croître. De plus, le siège de l’entreprise qui se situe dans le 9^ème arrondissement de Paris représente un coût certain.

Enfin le coût de suivi des appels et d’hébergement du site auxquelles il faut rajouter les différents canaux de marketing servant à attirer de nouveaux utilisateurs. Néanmoins, la plateforme bénéficie d’un effet de réseaux en étant leader sur ce segment de marché. Augmentant par la même occasion son rendement croissant d’adoption.

G) Les Revenus

Bien que nous n’ayons pas les montants exacts et la structure des revenus engendrés par l’entreprise, nous pouvons identifier plusieurs flux.

La première source de revenus provient des partenariats avec les entreprises. Ils se retrouvent à chaque étape de la plateforme. En effet, lorsqu’un utilisateur crée son profil on lui propose de créer un compte Orange Bank, ou lorsqu’un Advisor souhaite recevoir son argent, il doit créer un compte Pumkin. Les utilisateurs de la plateforme étant un segment bien particulier de clients, ils représentent une audience qualifiée pour ces pubs et génèrent donc plus de revenus à la plateforme.

Par ailleurs, les organismes de formation paient la plateforme afin d’être mis en avant. Cela génère des revenus importants pour StudyAdvisor car, afin d’attirer de nouveaux étudiants, ces organismes de formations sont prêts à payer pour atteindre une audience à l’écoute de leurs offres.

Enfin, les levées de fonds représentent, comme c’est le cas pour de nombreuses start up, un moyen important de financement. StudyAdvisor est actuellement en processus pour sa première levée de fonds. Par ailleurs, chaque année, StudyAdvisor génère un chiffre d’affaires en constante augmentation. En 2018, il était à plus de 500 000€. Grâce à son statut de SAS, StudyAdvisor a des avantages lors des levées de fonds. En effet, la SAS a l’avantage d’avoir une grande souplesse pour rédiger les statuts de ses actionnaires. Néanmoins, l’effet pervers de ce système tient dans le fait qu’une levée de fond s’accompagne souvent par des attentes importantes de la part des investisseurs en termes de retour sur investissement.

Figure 6 Business Model Canvas de StudyAdvisor

Conclusion

StudyAdvisor est une entreprise de l’économie collaborative car l’ensemble de son business model et de son activité tient dans la mise en relation de ces trois catégories d’utilisateurs. Nous avons mis en évidence l’interaction entre les différents segments de clientèle à l’aide du Business Model Canvas. En rouge nous avons les organismes de formations, en vert les Advisor et en bleu les Piou-Piou. Tout comme la plupart des plateformes pair à pair marchant, StudyAdvisor tire son avantage des effets de réseau indirect pour que les Piou-Piou s’inscrivent il faut que les Advisor soient nombreux et inversement[22]. Cependant, la caractéristique principale de ce marché fait que la masse critique du nombre d’inscrits doit être renouvelée tous les ans. En effet, comme nous l’avons analysé, l’entreprise se positionne sur un marché à fort potentiel mais qui nécessite un renouvellement constant de sa base d’utilisateurs car les Piou-Piou auront tendance à l’utiliser pendant une courte période. Les efforts de l’entreprise pour attirer de nouveaux utilisateurs seront donc constants dans le temps.

À cela il faut ajouter le rôle des organismes de formation qui bénéficient indirectement de cet effet de réseau. En effet, plus il y a d’utilisateurs sur StudyAdvisor, plus leur audience sera grande.

L’entreprise semble chercher à diversifier son offre en utilisant la stratégie « suivre l’appât[23] » grâce à l’audience de StudyAdvisor ils démarchent des utilisateurs afin de promouvoir Studycall et studyquiz. La première est une plateforme qui permet à des étudiants auto-entrepreneurs d’être rémunérés par l’appel de prospects. La deuxième est une plateforme qui aide les étudiants à réviser leurs cours.

Sources :

[1] Le nouveau marché de l’orientation scolaire. Article Mediapart : https://blogs.mediapart.fr/theo-r-et-mathurin-s/blog/060621/le-nouveau-marche-de-l-orientation-scolaire

[2] – [19] Comment l’école française aide-t-elle les élèves à construire leur orientation ? http://www.cnesco.fr/wp-content/uploads/2018/12/181211_Cnesco_Orientation_Dossier_synthese.pdf

[3] Business Model Canvas : Osterwalder, Alexander ; Pigneur, Yves; Clark, Tim (2010). Business Model Generation: A Handbook For Visionaries, Game Changers, and Challengers. Strategyzer series. Hoboken, NJ: John Wiley & Sons. ISBN 9780470876411. OCLC 648031756. With contributions from 470 practitioners from 45 countries

[4] L’éducation nationale en chiffres 2020 : https://www.education.gouv.fr/l-education-nationale-en-chiffres-2020-305457

[5] Matrice PESTEL : Définition et ressources : https://www.marketing-etudiant.fr/pestel-definition.html

[7]-[6] Site officiel de StudyAdvisor : https://www.studyadvisor.fr

[8]-[9] Study Advisor, la plateforme qui facilite l’orientation des jeunes – 07/11 BFM Business : https://www.dailymotion.com/video/x681xhx

[10] How Do You Value A Company Like Uber? : https://techcrunch.com/2015/10/10/valuing-uber/?guccounter=1&guce_referrer=aHR0cHM6Ly9sbXMuZnVuLW1vb2MuZnIv&guce_referrer_sig=AQAAAC4VHA2fjSchNdAHkN_20EZY56bLO0THKQGarQG9p1CbwI6O3zP-DukYOOWhJXx-KqG_S4kYlDQIMaqul-a0rxi9ckXifNoCdzcfLXio0sLADh_MNoEQ4BZ018RTwf-jWnNsXZAKRPkgj_jptdRpf74ns4gVdYQ40oac4OMqv47K

[11] Entreprendre et gouverner après la révolution numérique. Colin, N., & Verdier, H. (2015). L’âge de la multitude-2e éd. Armand Colin

[12] objectif parcoursup le guide alphaomega de l’orientation : https://www.alphaomegafondation.com/files/8b1d6a21/objectif_parcoursup_le_guide_alphaomega_de_l_orientation.pdf

[13] Site imagine ton futur : https://www.imaginetonfutur.com/tests-d-orientation

[14] Site inspire : https://inspire-orientation.org

[15] Site Futurness : https://my.futurness.com/test/gratuit

[16] Site pixis.com : https://pixis.co

[17] Site de Diplomeo : https://diplomeo.com

[18] Dossier d’aide à l’analyse de la concurrence BPI France : https://bpifrance-creation.fr/moment-de-vie/benchmark-comment-analyser-vos -concurrents#:~:text=Il%20existe%20deux%20types%20de%20concurrence%20%3A&text=La%

[20] Onetti, A., Zucchella, A., Jones, M., and McDougall-Covin, P. 2010. « Internationalization, innovation and entrepreneurship: business models for new technology-based firms, » Journal of Management and Go-vernance Vol.15 n°3, pp. 1-32

[21] Resnick, P. and Zeckhauser, R. (2002). “Trust Among Strangers in Internet Transactions: Empirical Analy-sis of eBay’s Reputation System.” The Economics of the Internet and E-Commerce. Michael R. Baye, editor.Volume 11 of Advances in Applied Microeconomics. Amsterdam, Elsevier Science.

[22] Parker G.G., Van Alstyne M.W., Choudairy S.P. (2016) : « Platform Revolution: How Networked Markets Are Transforming the Economy and How to Make Them Work for You »,W. W. Norton & Cie, New York

[23] Platform Revolution: How Networked Markets Are Transforming the Economy and How to Make Them Work for You. Parker, Van Alstyne et Choudary

Références utilisées dans le texte

[1] https://blogs.mediapart.fr/theo-r-et-mathurin-s/blog/060621/le-nouveau-marche-de-l-orientation-scolaire

[2] : http://www.cnesco.fr/wp-content/uploads/2018/12/181211_Cnesco_Orientation_Dossier_synthese.pdf

[3] Osterwalder, Alexander; Pigneur, Yves; Clark, Tim (2010). Business Model Generation: A Handbook For Visionaries, Game Changers, and Challengers. Strategyzer series. Hoboken, NJ: John Wiley & Sons. ISBN 9780470876411. OCLC 648031756. With contributions from 470 practitioners from 45 countries.

[4] https://www.education.gouv.fr/l-education-nationale-en-chiffres-2020-305457

[5] https://www.marketing-etudiant.fr/pestel-definition.html

[6] https://www.studyadvisor.fr/

[7] https://www.studyadvisor.fr/

[8] https://www.dailymotion.com/video/x681xhx

[9] https://www.dailymotion.com/video/x681xhx

[10] https://techcrunch.com/

[11] Colin, N., & Verdier, H. (2015). L’âge de la multitude-2e éd. : Entreprendre et gouverner après la révolution numérique. Armand Colin

[12] https://www.alphaomegafondation.com/files/8b1d6a21/objectif_parcoursup_le_guide_alphaomega_de_l_orientation.pdf

[13] https://www.imaginetonfutur.com/tests-d-orientation

[14] https://inspire-orientation.org

[15] https://my.futurness.com/test/gratuit

[16] https://pixis.co

[17] https://diplomeo.com/

[18] https://bpifrance-creation.fr/moment-de-vie/benchmark-comment-analyser-vos-concurrents#:~:text=Il%20existe%20deux%20types%20de%20concurrence%20%3A&text=La%

[19] http://www.cnesco.fr/wp-content/uploads/2018/12/181211_Cnesco_Orientation_Dossier_synthese.pdf

[20] Onetti, A., Zucchella, A., Jones, M., and McDougall-Covin, P. 2010. « Internationalization, innovation and entrepreneurship: business models for new technology-based firms, » Journal of Management and Governance Vol.15 n°3, pp. 1-32

[21] Resnick, P. and Zeckhauser, R. (2002). “Trust Among Strangers in Internet Transactions: Empirical Analysis of eBay’s Reputation System.” The Economics of the Internet and E-Commerce. Michael R. Baye, editor. Volume 11 of Advances in Applied Microeconomics. Amsterdam, Elsevier Science.

[22] Parker G.G., Van Alstyne M.W., Choudairy S.P. (2016) : « Platform Revolution: How Networked Markets Are Transforming the Economy and How to Make Them Work for You »,W. W. Norton & Cie, New York

[23] Platform Revolution: How Networked Markets Are Transforming the Economy and How to Make Them Work for You. Parker, Van Alstyne et Choudary

La plateforme coopérative Fairbnb: quel modèle économique?

L’économie collaborative est un modèle socio-économique de particuliers à particuliers basé sur l’échange ou le partage de biens et services. Elle peut être définie comme « une organisation de la collaboration et des échanges, marchands ou non, entre individus, avec le souci de partager des ressources, dans un contexte institutionnel assez peu contraignant ». (N’Guyen, 2016)

Le développement de cette économie du partage, popularisée aux États-Unis depuis la seconde guerre mondiale, a été fortement facilité par l’avènement des nouvelles technologies et d’internet. En effet, diverses plateformes en ligne se sont développées pour assurer le lien entre les personnes offreurs et ceux demandeurs de biens et services. La soudaine explosion de ces plateformes de pair à pair, et principalement des licornes qui en ont résulté, a bouleversé les écosystèmes et la dynamique des marchés sur lesquelles elles se sont implantées. Le marché de l’hébergement touristique ne fait pas figure d’exception : “the sharing economy is significantly changing consumptions patterns” (Zervias & David, 2016).

La location de logements entre particuliers via des plateformes intéressent de plus en plus les voyageurs, au détriment des hébergements traditionnels proposés par des professionnels : augmentation de 15% de la fréquentation des hébergements touristiques proposés par des particuliers via des plateformes internet en 2018 en France (Bahu, 2019). Ces plateformes ont aidé à dynamiser le secteur du tourisme, aujourd’hui le troisième secteur économique mondial, qui a de nombreux bénéfices économiques pour les territoires ; mais ce n’est pas sans être accompagné d’effets néfastes de plus en plus vilipendés (Rédaction, 2019).

C’est dans ce double contexte que s’est développée Fairbnb.coop, une plateforme collaborative de location d’hébergement pair à pair de courte durée, qui a pour ambition d’être un alter ego durable et éthique d’Airbnb. Le but de cette étude est d’expliquer la création et la proposition de valeur de la plateforme Fairbnb.coop au regard des problématiques actuelles du marché de l’hébergement touristique et d’analyser le positionnement de celle-ci au sein de son environnement concurrentiel.

Nous étudions dans le document les tenants et aboutissants actuels du secteur de l’hébergement touristique, puis la segmentation des clients potentiels et la proposition de valeur de Fairbnb, enfin nous présentons son positionnement dans son écosystème.

I) Les enjeux du secteur de l’hébergement touristique, une industrie critiquée qui doit se renouveler ?

Les plateformes de locations d’hébergement entre particuliers, qui sont l’incarnation de l’économie collaborative dans le secteur de l’hébergement touristique ont été vecteurs d’améliorations pour ces utilisateurs.

D’une part du côté de l’offre, car elles permettent aux particuliers d’entrer sur le marché et de valoriser leurs biens immobiliers en une source de revenu complémentaire. Et d’autre part du côté de la demande, en offrant la possibilité aux individus de trouver un logement à des prix souvent plus économiques qui ceux proposés par les professionnels du secteur, de voyager d’une autre manière et de vivre une expérience « authentique » avec des liens entre locaux et voyageurs mis en exergue.

De plus, l’enrichissement de l’offre d’hébergements de courte durée accroît l’attractivité des territoires, et a des retombées économiques positives sur ceux-ci, ainsi que sur les propriétaires louant leur logement. C’est, entre autres, pour ces raisons que ces plateformes connaissent un tel succès ces dernières années (Zervias & David, 2016).

Cependant, force est de constater que les flux touristiques croissants ont également leur lot de désavantages. Nombreux sont les exemples des conséquences désastreuses du tourisme de masse sur l’environnement (Rédaction, 2019) : surconsommation des ressources naturelles pour pallier les besoins des touristes ; augmentation de la masse de déchets produits, destruction des écosystèmes et nuisance à la biodiversité ou encore pollution de l’air. Le tourisme est responsable de 5% de émissions mondiales de CO2 en 2010 (1,3 milliards de tonnes) selon un rapport du ministère de la transition écologique (énergétique, 2010).

Figure 1: Offre de logements de location à courte durée à Venise en 2021. (AirDNA, 2021)

À ces pressions exercées sur l’environnement s’ajoutent des répercussions négatives sur les territoires et les populations locales. Certains sites particulièrement touristiques souffrent d’un véritable phénomène de saturation car les lieux ne sont pas en mesure d’accueillir autant de monde, tant au niveau des infrastructures qu’au niveau des ressources. Le tourisme de masse nuit également à l’équilibre de la vie locale : commerces touristiques et bars remplacent les commerces de quartier, prolifération d’hôtels et hébergements touristiques au détriment de logements pour les habitants ce qui induit une flambée des prix de l’immobilier et un déséquilibre du marché locatif, nuisances sonores …

Un exemple frappant est celui de la ville de Venise, avec 33 millions de visiteurs annuels pour 55 000 habitants, la ville présente une proportion de 545 touristes par Vénitien, ce qui a notamment des retombées désastreuses sur la lagune de Venise, les fondations de la cité et les Vénitiens eux-mêmes (Rédaction, 2019). La Figure 1 montre les offres de locations Airbnb à Venise et illustre parfaitement la forte implantation de l’entreprise dans la ville.

Les plateformes de location d’hébergements pair à pair, et particulièrement leur leader Airbnb, sont aujourd’hui vivement critiquées, études à l’appui, pour avoir une part de responsabilité notable dans ces effets. Plus particulièrement, d’accélérer le phénomène de gentrification des villes, qui correspond au dépeuplement des centres ville dû au départ des classes populaires contraintes de déménager face à l’augmentation du coût de la vie (Stergiou & Farmaki, 2019) (Nieuwland & Van Melik, 2020).

Par ailleurs, l’absence de cadre juridique spécifique pour les plateformes de pair à pair (Pouly, 2016) complique le contrôle des locations pour les municipalités, malgré les initiatives pour une meilleure régulation qui se multiplient. L’article 51 de la loi n°2016-1321 pour une République numérique stipulant que les annonces doivent comporter un numéro d’enregistrement pour vérifier que les hébergements ne sont pas loués plus de 120 nuitées par an en est un exemple (République Française, 2016).

C’est dans ce contexte qu’est née en 2018 la coopérative Fairbnb. Celle-ci se veut être l’alter ego durable et éthique de Airbnb. Selon les mots du co-fondateur de Airbnb, Emanuele Dal Carlo : « The initial ground-breaking and innovative idea of home-sharing promoted by platforms like Airbnb have changed […] We combined our backgrounds of social entrepreneurship, activism and a cooperative approach to propose a model of sharing economy that is better for the users, for the communities and the touristic market itself » (Girardi, Fairbnb: The Ethical Home-Sharing Alternative That Wants To Undermine Mass Tourism, 2019) (O'Sullivan, 2019).

Fairbnb se définit comme une « plateforme de réservation sociale et de crowdfunding qui vise à limiter les effets négatifs du tourisme, en amplifiant son impact positif sur la communauté d’accueil » (Fairbnb).

La suite de cette étude a pour objectif de comprendre les raisons qui pousseraient les loueurs, dont les utilisateurs d’Airbnb, à utiliser préférentiellement cette plateforme.

II) Segmentation des clients et proposition de valeur de Fairbnb.

À l’image d’Airbnb, Fairbnb est une plateforme collaborative de mise en relation de particuliers pour la location d’hébergements de courte durée. C’est donc une plateforme jouant l’intermédiaire entre deux groupes de clients. D’une part, les hôtes pour lesquels la fonction principale est de proposer à la location un hébergement à durée limitée. D’autre part, les voyageurs, dont la fonction principale est de louer un logement de courte durée lors d’un déplacement.

Figure 2 : Schéma résumant les interactions des acteurs en lien avec Fairbnb, logo (Fairbnb)

La plateforme se positionne donc en tant qu’acteur du secteur de l’hébergement touristique, un domaine riche par la grande diversité de clients qu’il contient. Du côté de la demande, les voyageurs peuvent être divisés en plusieurs segments selon les attentes et besoins qu’ils expriment quant à leur voyage. Ceux-ci peuvent être par exemple, la durée et le prix du séjour, la possibilité de se faire à manger, le type de voyage (en autonomie ou au sein d’un groupe)…

L’organisation mondiale du tourisme (OMT) a proposé une classification des voyageurs en neuf segments selon les motifs de visites comme l’indique la Figure 3.

Figure 3 : Classification des voyageurs selon l’OMT, (Guibilato, 1983)

Une autre segmentation possible est établie en fonction du type de tourisme recherché : tourisme vert, tourisme urbain, tourisme bleu, tourisme religieux, tourisme d’affaires… (études&analyses, 2018).

Du côté de l’offre, il existe plusieurs types d’acteurs associés à différentes offres de logements pour répondre aux divers besoins exprimés par les consommateurs. On peut ainsi distinguer les agences de voyage et tours opérateurs, les franchises et chaines hôtelières (Hilton, Ibis, …) et les hébergements de tous types détenus par des particuliers (hôtels, chambre d’hôtes, B&B, gites, maisons/appartements individuels…) Partant de cette segmentation, on déduit que la plateforme Fairbnb s’adresse, pour les offreurs, aux particuliers possédant une maison, un appartement, un hôtel ou encore une auberge B&B et souhaitant le louer à d’autres particuliers pour une durée limitée.

La plateforme met en avant des offres proposant différents types de logements (cf. Figure 4), dans plusieurs destinations européennes (cf. Figure 5), avec une large fourchette de prix : 30€ à 400€ la nuit (Fairbnb). Le voyageur peut affiner sa recherche selon plusieurs critères : nombre de lits (double/simple), présence d’une cuisine/salle de bain (partagée ou non), d’un espace de travail, activités aux alentours … À cela s’ajoutent des services optionnels proposés par les propriétaires tels qu’un service de ménage ou des visites guidées.

Figure 4 : Types de logements proposés à la location sur Fairbnb (Fairbnb).

Figure 5 : Destinations couvertes par la plateforme (Fairbnb).

La stratégie de Fairbnb est donc de cibler plusieurs segments de voyageurs simultanément grâce à un large spectre d’offres, certes non personnalisé, mais susceptible d’attirer du monde par son volume.

La stratégie ayant été décidée et les segments de clients à attirer choisis, l’étude de la proposition de valeur de Fairbnb indique comment la plateforme répond aux attentes, besoins et problèmes selon le profil de ses clients. En tant que plateforme biface, Fairbnb a donc deux propositions de valeur distinctes : l’une à l’attention des hôtes, et l’autre concernant les voyageurs. Celles-ci sont résumées ci-dessous (Figure 6, Figure 7) selon le modèle du canevas de proposition de valeur (Wikicréa, 2019). Il présente sur la partie droite le profil client, correspondant aux attentes, besoins et problèmes du client, et sur la partie gauche, la proposition de valeur établie par Fairbnb, exposant les produits et services de la plateforme, les gains à l’utilisation pour le client et des solutions aux difficultés exprimées par ces derniers. À noter que les propositions de valeur ci-dessous ontété construites en s’inspirant de celles d’Airbnb, les deux étant très similaires car Fairbnb s’est construite en partant du modèle d’Airbnb (Onopia, 2018).

Figure 6 : Proposition de valeur pour les **hôtes**.

Figure 7 : Proposition de valeur pour les **voyageurs**.

Les éléments distincts dans les propositions de valeurs de Fairbnb et Airbnb (surlignés en jaune sur les figures ci-dessus), et donc qui seraient susceptibles de motiver les consommateurs à utiliser cette plateforme plutôt qu’une autre, concernent majoritairement des résolutions la durabilité et de l’écoresponsabilité. Il est intéressant de noter que ces dissemblances restent parcimonieuses. L’offre est globalement une offre de substitution, or pour s’intégrer sur un marché très concurrentiel avec un leader, il est impératif de se différencier, d’avoir une valeur ajoutée. Si cette différenciation ne s’opère pas sur l’offre, sur quoi repose-t-elle ? Ainsi, l’on peut se demander comment et dans quelle mesure Fairbnb se différencie réellement des autres plateformes. C’est ce que nous allons analyser par la suite.

III) Le positionnement de Fairbnb au sein de l’écosystème de l’hébergement touristique

Comme l’indique la Figure 8, le tourisme est une industrie regroupant un riche réseau d’acteurs. Compte tenu de la grande diversité d’offres de location de courte durée présente sur le marché, Fairbnb se situe dans un environnement concurrentiel très fort, parfois déjà saturé (Rédaction, 2019). Deux catégories de concurrents sont distinguables. Les grands acteurs professionnels : agences de voyage, tours opérateurs, franchises et chaînes hôtelières (cf. la segmentation des offreurs) qui sont en concurrence indirecte ; et les autres plateformes en ligne pair à pair de location de logements de courte durée, formant la concurrence directe.

Figure 8 : Les acteurs du tourisme, (Steck, Strasdas, & Evelyn, 2000)

Pour les entreprises en concurrence indirecte, Fairbnb présente une forte valeur ajoutée : voyager autrement, moins cher, développement d’un lien social plus fort avec les locaux. Les clients ciblés, certes se recoupent, mais ne sont globalement pas les mêmes. Il est donc facile pour Fairbnb de se différencier.

Parmi les concurrents directs, sont à citer les géants Booking.com, Airbnb, Vrbo (anciennement HomeAway) et Abritel pour la France. La proposition de valeur présentée par Fairbnb est très similaire à celle de ces enseignes, notamment de celle de Airbnb dont elle s’est inspirée du principe. L’enjeu pour Fairbnb est ici de réussir à se différencier de ces enseignes afin de capter des clients et de ne pas être juste une plateforme de location d’hébergement supplémentaire.

Pour « sortir de l’ombre » des grands plateformes internationales, Fairbnb présente une offre de substitution destinée à conquérir plus spécifiquement une niche de marché restreinte, celle du tourisme durable et de l’écotourisme, à plus forte valeur ajoutée (Nelson, Partelow, Stäbler, Graci, & Fujitani, 2021). En effet, Fairbnb souhaite proposer une solution alternative qui minimiser les effets néfastes, abordés ci-dessus, dont ces concurrents sont accusés. La plateforme promeut donc un tourisme éthique et durable, à même de capter plus précisément les clients du segment du tourisme vert ou écotourisme, dont de plus en plus de voyageurs se disent attentifs (Nelson, Partelow, Stäbler, Graci, & Fujitani, 2021). L’enquête PIPAME de 2015 (Pipame, 2015) sur les enjeux et perspectives de l’économie collaborative a établi une typologie des Français selon cinq profils particuliers de demandeurs et offreurs collaboratifs (cf. Figure 9).

Figure 9 : Typologie des français en 2015 par rapport à la consommation collaborative, (Pipame, 2015)

Selon cette typologie, les cibles de Fairbnb sont les engagés et les futurs adeptes idéalistes. Les premiers placent les préoccupations sociales et environnementales au cœur de leur démarche et pratiquent la consommation collaborative au quotidien, tandis que les seconds sont fortement attachés à ces mêmes valeurs de solidarité, de respect de l’environnement, de convivialité et de partage mais ne sont des pratiquants que très occasionnels. Au total, cela représente 46% des personnes, mais avec plus des trois-quarts pour qui l’adhésion n’est pas totalement acquise, le modèle étant juste prometteur pour l’avenir. Ainsi, la niche visée est marginale sur le marché actuel, mais vouée à augmenter dans les années à venir.

La différence majeure réside dans l’organisation même de la plateforme. En effet, Fairbnb est une coopérative, la gouvernance est donc partagée entre tous ces utilisateurs, et est organisée en nœuds locaux qui forment un réseau de communautés interconnectées. L’idée est que chaque ville ou zone spécifique développe sa propre communauté sur la base du volontariat des personnes y habitant. Un tableau comparatif de Airbnb et Fairbnb est disponible en annexe.

Figure 10 : Modèle économique de Fairbnb, (Fairbnb, 2021).

Concernant son financement, la plateforme prélève des commissions sur le prix à payer par le voyageur lors de sa réservation (cf. Figure 10). La moitié de la valeur captée est gardée par Fairbnb, et l’autre moitié est réinvestie pour financer des projets communautaires propres à chaque nœud : un centre de distribution de nourriture en partenariat avec l’association Re-food pour lutter contre le gaspillage alimentaire à Porto, ou encore le financement du projet « Co.Co Farm 2021 » de la coopérative Terre Del Magra dans la région de la Ligurie en Italie pour une gestion des sols plus durable (Fairbnb, 2021).

L’objectif de cette politique est, selon Fairbnb, d’avoir une meilleure répartition de la valeur créée, qui bénéficie, non seulement à la plateforme, mais aussi aux résidents des zones touristiques. La redistribution des profits serait ainsi plus équitable au sein de la communauté qui les produit, selon un modèle d’économie circulaire. La plateforme veut se placer, dans l’esprit des consommateurs, comme une un acteur véritable de l’économie sociale et solidaire avec une structure pair à pair collaboratif, qui renoue avec les valeurs de partage, de durabilité et de solidarité.

Fairbnb crédibilise sa position en s’appuyant sur plusieurs piliers. En premier, la collaboration avec un troisième acteur : le secteur public (cf. Figure 8). Chaque hôte doit fournir la preuve qu’ils sont en règle avec les réglementations et autorités locales, et que la location de leur logement est déclarée et légale. Ensuite, le financement de projets choisis et gérés par les locaux présenté ci-dessus. Puis la règle « 1 host, 1 house » qui stipule que les propriétaires ne doivent posséder qu’un seul bien immobilier sur le marché de la location touristique pour être acceptés sur la plateforme, sachant que pour les zones sujettes à un fort phénomène de gentrification comme Venise ou Florence, le propriétaire doit également être résident. Les gros investisseurs immobiliers, possédant plusieurs propriétés dans les centres villes et destinées aux touristes ne peuvent donc pas être des hôtes sur la plateforme (Borg, 2021). Le dernier pilier est la transparence : dans le respect du RGPD, les données récoltées par Fairbnb sont partagées avec les municipalités, pour aider au développement futur des territoires. Un accord a notamment été signé entre Fairbnb et la ville de Gênes pour s’assurer que les annonces soient aux normes, la plateforme doit communiquer à la ville la liste des structures enregistrées et le nombre de réservations reçues. Elle a aussi la charge de récolter la taxe touristique imposée par la réglementation municipale puis de la reverser à la municipalité (Commune de Gênes, 2020).

Un élément décisif pour le développement et le succès de la plateforme est le dépassement de sa masse critique. Comme Fairbnb est une plateforme biface, cela est d’autant plus compliqué ; sans parler de la difficulté à initier une offre dans un environnement aussi concurrentiel. Pour ce faire, plusieurs stratégies ont été adoptées par celle-ci.

Le versant mobilisé en premier (pour ensuite attirer l’autre par effet de réseaux indirects) a été celui des hôtes. En effet, si l’on réfère aux façons de procéder pour ce faire mises en évidence par Parker, Van Alstyne et Choudary (2016), Fairbnb a choisi de « suivre l’appât », d’établir une « marquee strategy » et de privilégier le versant ayant la plus forte d’attraction, ici les hôtes (sans offre de location, il n’y a pas de potentiels locataires, alors que les propriétaires n’ont « rien à perdre » à être présent sur la plateforme car l’inscription est gratuite). La première méthode consiste à suivre le modèle d’une plateforme déjà existante, Airbnb, pour créer Fairbnb, cela joue un rôle « d’appât » susceptible d’attirer les clients qui feront face à une offre à laquelle ils sont familier. La différenciation s’effectue alors, non pas sur l’offre de service, mais sur le développement d’atouts secondaires, comme les partenariats avec des collectivités locales. La « marquee strategy » réside dans le ciblage de participants privilégiés, ici les ambassadeurs, qui assureront la promotion de la plateforme auprès de la multitude et inciteront les autres à venir sur cette dernière. Enfin, Fairbnb a avantagé le versant des hôtes avec l’absence de commissions prélevées à ceux-ci, et donc l’utilisation « gratuite » de la plateforme.

De plus, la mise en place d’une tarification différenciée selon le versant est un outil déterminant qui a également été souligné par Jean Tirole (Tirole, 2016) concernant la capacité d’une plateforme à atteindre la masse critique.

IV) Ressources, partenaires clés et modèle d’affaires

L’analyse du modèle d’affaires de Fairbnb permet de montrer comment la proposition de valeur de ce dernier est convertie en source de revenu et comment les ressources et partenaires stratégiques sont utilisés pour créer cette valeur. Avoir un bon modèle d’affaires est capital pour assurer la pérennité de la plateforme « a company has at least as much value to gain from developing an innovative new business model as from developing an innovative new technology » (Chesbrough, 2010).

Comme le souligne H. Chesbrough (2010), un modèles d’affaires a pour fonction d’articuler la proposition de valeur, d’identifier les segments de marchés et de préciser le mécanisme de création de revenu, d’estimer la structure des coûts et les potentiels profits, de décrire la position de la firme dans le réseau liant les consommateurs et les offreurs et de formuler la stratégie compétitive qui permet à l’entreprise de gagner et garder un avantage sur ses rivaux activités et ressources clés).

Les ressources sont les déterminants fondamentaux de l’avantage concurrentiel durable d’une entreprise. Ainsi, identifier ses ressources clés potentielles, les développer et les protéger est primordial pour toute entreprise souhaitant s’intégrer et dépasser la concurrence dans son environnement économique. Pour ce faire, les entreprises peuvent s’appuyer sur le modèle VRIN (aujourd’hui VRIO) développé en 1991 J. Barney selon lequel les ressources sont dites stratégiques si elles répondent aux quatre critères suivants : valorisable, rare, inimitable et non substituable (Barney, 1991).

Figure 11 : Les ressources et compétences stratégiques selon le modèle VRIN (L’analyse des ressources et des compétences, 2021).

Plusieurs ressources de Fairbnb peuvent être relevées, analysons dans quelle mesure elles sont stratégiques au regard de ce modèle. D’abord, les ressources tangibles qui correspondent aux ressources humaines, financières et techniques (Wikipedia). Avoir un portefeuille fourni de logements à louer est ressource pour telle plateforme, l’objectif étant d’avoir une offre riche et variée, et particulièrement dans des zones prisées où la demande est plus forte et donc l’appariement entre les deux versants (hôtes et voyageurs) de la plateforme est meilleur. Certes cette ressource est valorisable et substituable, mais pour Fairbnb elle n’est malheureusement ni rare ni inimitable car Fairbnb autorise le multihoming. À titre d’exemple, Airbnb comptait 5,6 millions d’offres de logements à travers le monde au 30/06/2021 (Airbnb, About us, 2021) contre seulement 21 nœuds actifs pour Fairbnb. Une autre ressource importante pour une plateforme de location de logements tel Fairbnb est son réseau d’hôtes. En effet, plus il y a d’hôtes, plus grand est l’inventaire dans lequel les voyageurs peuvent choisir un logement et vivre différentes expériences et séjours. Cette ressource est également valorisable et non substituable, mais pour le même argument que précédemment, elle est loin d’être rare et inimitable (4 millions d’hôtes sur Airbnb au 30/06/2021 (Airbnb, About us, 2021)). Il est toutefois intéressant de noter que si l’on considère seulement les hôtes « engagés » ou « futurs adeptes idéalistes » (cf. III), alors cette ressource se différencie de celle d’autres plateformes similaires et reprend un aspect rare et inimitable. Cela nous amène à une troisième ressource : les ambassadeurs. Ce sont des hôtes ou voyageurs qui sont très investis dans le développement, ils promeuvent la plateforme dans chaque nœud et sont responsables de son rayonnement. Cette ressource présente bien les quatre critères VRIN et est donc clé pour Fairbnb.

D’un point de vue technologique, tout ce qui a trait au système d’information puis à leur analyse sont également des ressources car être en mesure de recueillir des informations sur les utilisateurs et de les traiter est essentiel pour le développement de la plateforme. Il s’agit des bases de données stockant les profils utilisateurs et leur comportement (« Internet-browsing technical data, Registration Data, Host Profile data, Payment data and Listing data » (Fairbnb, Privacy statement)), et des algorithmes d’évaluation et de management de la performance notamment. Les algorithmes de recherche et d’appariement utilisés par les voyageurs lorsqu’ils recherchent une location sur la plateforme en fonction de leurs critères sont propres à Fairbnb et sont aussi essentiels. Les bases de données sont bien une ressource clé car la liste des utilisateurs de Fairbnb est unique et leurs habitudes sur cette plateforme aussi, bien que cela soit discutable étant donné que les utilisateurs peuvent être présents sur plusieurs plateformes similaires.

Ensuite, il existe des ressources intangibles qui regroupent les procédures et routines mises en place par l’entreprise. Pour Fairbnb, l’implication et le sentiment d’appartenance organisationnelle due à la structure de communauté et de coopérative valide les quatre critères VRIN. De même, la politique RSE, très développée chez Fairbnb, peut être considérée comme une ressource clé.

Afin de se procurer les ressources, les entreprises sont amenées à faire appel aux services de tiers appelés partenaires. Les partenaires clés les plus importants pour Fairbnb sont également une de ces ressources clés : les hôtes. Comme expliqué ci-dessus, aident à délivrer la proposition de valeur du côté de la demande (voyageurs) car atteindre une masse critique pour l’offre et garantir sa grande diversité est important pour leur proposition de valeur. Une autre catégorie de partenaires regroupe les fournisseurs de solutions de paiement en ligne : comme le rappelle G. Dang Nguyen (Nguyen, Chapitre 2 : braderies high tech et plateformes, 2020), une des missions phare d’une plateforme de pair à pair collaboratif est de gérer les relations entre versants. Dans ce cas, il s’agit notamment d’organiser concrètement les transactions. Pour Fairbnb, ces partenaires sont MangoPay, Crédit Mutuel Arkea et Payline by monext (Fairbnb, terms of use).

Figure 12 : Les partenaires de Fairbnb pour la gestion du paiement en ligne

Enfin, Fairbnb appuie sa proposition de valeur et son engagement durable sur des partenariats avec des collectivités locales et le reversement d’une partie de la valeur captée à des ONG pour financer des projets communautaires. Ces instances représentent un atout fort pour Fairbnb car il s’agit d’un point de différenciation de la plateforme par rapport aux autres. Ces partenariats sont donc également clés. Travailler avec des ONG est un choix stratégique : celles-ci aident Fairbnb à mettre en œuvre ses engagements pour le développement durable et à promouvoir sa politique RSE, qui rappelons-le, constitue une ressource clé. Cette collaboration est un bon argument marketing pour la niche de marché visée (écoresponsable, durable, …) et permet à Fairbnb de s’attirer les faveurs et la reconnaissance des utilisateurs, ces derniers étant plus sensibles aux problématiques précédentes (cf. partie III). L’entreprise minimise ainsi le risque de boycott de sa plateforme, comme ce qui arrive à Airbnb ; on peut même supposer qu’elle draine les ex-utilisateurs désabusés de Airbnb grâce à ces partenariats.

Le modèle d’affaires peut être formalisé selon le canevas proposé par Osterwalder & Pigneur (2010). C’est un outil permettant de cartographier synthétiquement les pierres angulaires d’un projet.

Le business model canevas de Fairbnb (Figure 13) résume les divers éléments structurant la coopérative Fairbnb présentés dans les paragraphes et parties précédentes.

Figure 13 : Business model canevas de Fairbnb selon le modèle d’Osterwalder et Pigneur.

Comme le souligne G. Nguyen (Chapitre 2 : braderies high tech et plateformes, 2020), l’avantage concurrentiel d’une plateforme se construit sur la gestion de la dynamique des effets de réseaux directs et indirects. Fairbnb peine à construire un important réseau d’utilisateur car le marché est déjà structuré et trusté par d’autres plateformes (cf. concurrents). Construire une nouvelle base de clients fidélisés est ici d’autant plus difficile car que le coût de transfert des utilisateurs lié au changement de plateforme est élevé : les utilisateurs potentiels peuvent déjà avoir acquis une notoriété sur un autre site (hôtes cinq étoiles sur Airbnb) et que le système de commentaires et de notation est peu développé chez Fairbnb : on ne peut y avoir accès si l’on n’est pas membre du réseau social fairbnb.coop. C’est une faiblesse pour Fairbnb car les systèmes d’évaluations sont des éléments clés du modèle des plateformes : ils contribuent à réduire les coûts de transactions dû aux asymétries d’informations entre les versants et à garantir la qualité du produit.

Le fait que le portefeuille de logements et le réseau d’hôtes ne soient pas rare et inimitable est aussi un fort handicap pour le développement de Fairbnb car être en situation de neutralité compétitive sur ces points met grandement en péril l’entretien des effets de réseaux.

Selon la théorie de la contingence, l’environnement est un facteur externe à ne pas négliger. Si l’on se réfère aux critères émis par Thomas R. Burns & Georges M. Stalker (1961), Fairbnb se situe dans un environnement dynamique et axé sur la technologie (marché et technologie en incertitude forte). Ainsi, le site web (design, ergonomie, algorithmes…) et les compétences en systèmes d’informations, traitements de données, et algorithmes d’appariements doivent être parfaites. De ce point de vue, c’est aussi une faiblesse de Fairbnb car le site n’est pas très facile d’utilisation (les pages sont mal répertoriées, difficiles à trouver et manquantes selon la langue choisie), lent et les bases de données peu fournies.

Concernant la coopération avec les ONG et projets locaux, un bémol est à retenir: la communication et le manque de transparence sur les activités sont des éléments susceptibles d’altérer la confiance des utilisateurs. La transparence financière, la cohérence des actions mises en place et les processus de décisions des ONG sont par ailleurs des aspects souvent critiqués : le constat émis par la fondation Prometheus à l’issue de la sixième édition (2016) de son baromètre de transparence des ONG est qu’elles demeurent opaques (Carayon, 2016).

Néanmoins, des forces sont à relever : Fairbnb a su développer un réseau de partenaires institutionnels étoffé, ce qui assoit sa crédibilité et accroit sa capacité à gagner de l’argent via des levées de fonds. Ce sont un million d’euros qui ont récemment été récolté par la plateforme (Bologna, 2021), ce montant est toutefois à mettre en perspective car même s’il apparait conséquent, il ne sera pas suffisant pour très longtemps.

Une stratégie d’engagement (Nguyen, Chapitre 2 : braderies high tech et plateformes, 2020) est également développée : Fairbnb est partenaires et sponsorise un nombre croissant d’évènements comme le marathon de Venise (Fairbnb, 2021).

Selon Alfred D. Chandler, la stratégie est un facteur interne de contingence, et l’adoption de toute stratégie implique des changements de structures dans l’organisation en question. Pour accroitre son rayonnement, Fairbnb fait le choix judicieux d’une stratégie d’expansion géographique grâce au développement d’un organe « administratif ». Pour cela, la plateforme s’est appuyée sur un des éléments qui lui est propre : son réseau d’ambassadeurs.

V) Conclusion et limites.

Le plateforme Fairbnb, bien que toujours en phase de développement, nourrit l’espoir d’un tourisme durable, éthique et économiquement viable, en mesure de contrer les effets négatifs du tourisme de masse.

Le projet gagne en visibilité et en reconnaissance grâce à des articles à son sujet dans des journaux ou blogs renommés (Girardi, 2019, Manthei, 2021, Williams, 2021, Zee, 2019). Un rapport dirigé par la Commission européenne a mentionné Fairbnb comme étant un « exemple à succès » montrant le « potentiel des plateformes sociales et nouvelles technologies peut aider l’économie sociale à poursuivre sa mission et devenir plus durable » (International, UNU-MERIT, & Research, 2020). La plateforme a également été lauréate du prix international du tourisme durable 2020 de Skål International, une organisation professionnelle du tourisme dans la catégorie « Urban accommodation » (Skål International, 2020).

Une étude réalisée en 2021 a examiné dans quelle mesure Airbnb et Fairbnb représentent l’économie collaborative, la conclusion a été que cette dernière est un plus fort exemple de l’économie sociale et solidaire, et du pair à pair collaboratif que son homologue Airbnb (Petruzzia, Marquesa, & Sheppard, 2021).

Ainsi, la coopérative Fairbnb montre les qualités d’une plateforme collaborative dans laquelle les valeurs de partage, d’éthique et de durabilité sont présentes. Malgré les reconnaissances extérieures de plus en plus nombreuses, force est de constater que la plateforme soutient le respect de ses valeurs et engagements uniquement par une politique d’autorégulation basée sur différents axes présentés en amont. Cette stratégie unilatérale de s’imposer publiquement des obligations pour neutraliser l’opportunisme est évoquée par Lucien Karpik (2007) dans L’économie des singularités. Par exemple, la vérification des exigences données par la plateforme aux hôtes n’est pas claire : comment s’assurent-ils qu’un hôte ne loue pas un bien, non référencé sur Fairbnb, sur une autre plateforme, ce qui serait contraire à la règle « one host one home ». J’ai contacté l’ambassadrice parisienne de Fairbnb pour illuminer ces zones d’ombres, mais n’ai pas eu de retour… Des certifications, un contrôle avec des organismes impartiaux et reconnus, ainsi que des partenariats clairs avec des instances gouvernementales seraient préférables afin d’assurer la bonne mise en application de leurs affirmations et les réelles retombées sur les communautés et le tourisme. La coopérative étant jeune, il est donc difficile de certifier les améliorations apportées par celles-ci par rapport aux problèmes qu’elle prétend minimiser, d’autant plus que les lieux de présence de la plateforme sont majoritairement des villes très touristique présentant une offre déjà saturée, ce qui semble paradoxal et risquerait à l’inverse d’empirer la situation. En outre, les hôtes sont autorisés à être présent sur plusieurs plateformes, ce qui leur assurerait alors juste un référencement supplémentaire. La décision de tolérer le multi-homing est à double tranchant. Certes, il est bénéfique (et nécessaire !) pour Fairbnb car il aide la coexistence entre plusieurs plateformes en tempérant les effets de réseau à mener à une situation de monopole « winner takes all » (c’est presque le cas avec Airbnb).

B. Jullien et W. Sand-Zantman (2019) expliquent que le multi référencement permet aux acteurs de tirer parti d’effets de réseaux plus importants, ce qui augmentent l’attractivité de Fairbnb face à un Airbnb prédominant. Mais cela impacte la crédibilité et la réalité de l’innovation mise en avant par Fairbnb : si une même maison peut être indifféremment sur une autre plateforme, où est l’intérêt de cette plateforme et en quoi la location est-elle plus responsable sur Fairbnb ?

L’avenir de Fairbnb reste pour le moment très incertain : celle-ci n’a clairement pas atteint la masse critique au regard du nombre restreint de destinations couvertes, du nombre de locations effectuées via celle-ci (beaucoup de résultats sur la plateforme présentent des offres pour lesquelles les hôtes n’ont reçu aucunes réservations), et du nombre d’utilisateurs (Fairbnb, 2021). Sa pérennité et son expansion seront de plus en plus compliqués sachant que Airbnb a récemment annoncé une nouvelle politique pour un tourisme responsable, ce qui atténue la différenciation de ces deux acteurs (Airbnb, Airbnb annonce une série d’engagements pour un tourisme responsable, 2021).

Une matrice SWOT résumant tous les points abordés dans cette étude est disponible en annexe (Tableau 2).

Véritable initiative durable et solidaire ou argument marketing de type greenwashing pour attirer un nouveau segment de marché ? Il est difficile de trancher à l’heure actuelle, même s’il apparaît que ce soit davantage une plateforme commerciale agrégeant des communautés par des objectifs sociaux et de durabilité qu’une réelle plateforme de pair à pair collaboratif. Une prise de recul avec le temps sera peut-être en mesure de guider la réponse.

Bibliographie

Airbnb. (2021). About us. Récupéré sur Airbnb: https://news.airbnb.com/about-us/

Airbnb. (2021, février 7). Airbnb annonce une série d’engagements pour un tourisme responsable. Récupéré sur Airbnb: https://news.airbnb.com/fr/airbnb-annonce-une-serie-dengagements-pour-un-tourisme-responsable/

AirDNA. (2021). Récupéré sur https://www.airdna.co/vacation-rental-data/app/it/veneto/venice/overview

Bahu, M. (2019). Les logements touristiques de particuliers loués via Internet séduisent toujours. INSEE.

Balagué, C. (2016). Semaine 2, partie 4 : Réseau pair à pair et community management. Dans MOOC Comprendre l’économie collaborative.

Barney, J. (1991). Firm resources and sustained competitive advantage. Journal of Management, 99-120.

Bologna, L. (2021, novembre 04). FairBnb Network: Investimenti per la piattafoma cooperativa. Récupéré sur Legacoop Bologna: https://www.legacoop.bologna.it/fair-bnb-network-investimenti-per-la-piattaforma-cooperativa/11/2021/

Borg, P. J. (2021). EcoBnB & FairBnB.coop Come base di ripartenza post-covid19 Per un turismo piu sostenibile. Venise: Université Ca’Foscari de Venise.

Burns, T. R., & Stalker, G. M. (1961). The Management of innovation .

Carayon, B. (2016). Baromètre de transparence des ONG 2015-2016. Récupéré sur Fondation Prometheus: https://web.archive.org/web/20180514122109/http://www.fondation-prometheus.org/wsite/publications/a-la-une/baromètre-2015-2016

CFI. (s.d.). Cooperazione finanza impresa. Récupéré sur CFI: https://www.cfi.it

Chesbrough, H. (2010). Business Model Innovation: Opportunities and Barriers. Long Range Planning, 354-363.

CommunedeGênes. (2020, mai 21). Un patto con la piattaforma Fairbnb.coop e il network Wonderful Italy per rilanciare il turismo. Récupéré sur https://smart.comune.genova.it/comunicati-stampa-articoli/un-patto-con-la-piattaforma-fairbnbcoop-e-il-network-wonderful-italy

énergétique, D. g. (2010). Les stratégies nationales du tourisme et du climat.

études&analyses. (2018). Récupéré sur https://www.etudes-et-analyses.com/marketing/marketing-du-tourisme/etude-de-marche/typologies-tourisme-486547.html?utm_source=blog&utm_medium=internal

Fairbnb. (2021). Récupéré sur Fairbnb: https://fairbnb.coop

Fairbnb. (2021, octobre). Fairbnb.coop Digest #7 – Fresh news from our coop ecosystem. Récupéré sur Fairbnb: https://fairbnb.coop/2021/11/24/fairbnb-coop-digest-7-fresh-news-from-our-coop-ecosystem/?utm_source=in_page&utm_medium=Fairbnb.coop+-+LinkedIN&utm_campaign=publer

Fairbnb. (s.d.). Privacy statement. Récupéré sur Fairbnb: https://fairbnb.coop/privacy-statement/

Fairbnb. (s.d.). terms of use. Récupéré sur Fairbnb: https://fairbnb.coop/terms-of-use/

Focus. (s.d.). Récupéré sur http://www.coop-focus.it/comunication.php

République Française, R. (2016, octobre 7). LOI n° 2016-1321 pour une République numérique. Récupéré sur Legifrance: https://www.legifrance.gouv.fr/jorf/id/JORFTEXT000033202746

Girardi, A. (2019, mars 21). Fairbnb: The Ethical Home-Sharing Alternative That Wants To Undermine Mass Tourism. Forbes.

Girardi, A. (2019, mars 21). Fairbnb: The Ethical Home-Sharing Alternative That Wants To Undermine Mass Tourism. Récupéré sur Forbes: https://www.forbes.com/sites/annalisagirardi/2019/03/21/fairbnb-the-ethical-home-sharing-alternative-that-wants-to-undermine-mass-tourism/

Guibilato, G. (1983). Économie touristique. Delta & spés.

International, Q.-P., UNU-MERIT, & Research, M. I. (2020). New technologies and digitisation Opportunities and challenges for the social economy and social economy enterprises. European Commission.

Jullien, B., & Sand-Zantman, W. (2019). The Economics of Platforms: A Theory Guide for Competition Policy. TSE Digital Center Policy Papers series.

Karpik, L. (2007). L’économie des singularités. Gallimard.

L’analyse des ressources et des compétences. (2021, novembre 24). Récupéré sur Apprendre l’économie et la gestion: https://apprendreéconomie.com/ressources-et-competences/

Manthei, E. (2021, juillet 22). All hail FairBnB, the new sustainable home sharing platform . Récupéré sur Independent: https://www.independent.co.uk/climate-change/sustainable-living/fairbnb-sustainable-tourism-home-sharing-b1887387.html

Nelson, K. M., Partelow, S., Stäbler, M., Graci, S., & Fujitani, M. (2021). Tourist willingness to pay for local green hotel certification. PLOS ONE.

NGI. (s.d.). Ledger Project. Récupéré sur https://ledgerproject.eu

NGuyen, G. D. (2016). Semaine 1, Partie 1 : Caractériser le pair à pair. Dans MOOC Comprendre l’économie collaborative.

NGuyen, G. D. (2016). Semaine 3, Partie 1 : Splendeur et misère du néo-entrepreneur. Dans MOOC Comprendre l’économie collaborative.

NGuyen, G. D. (2022). Chapitre 2 : braderies high tech et plateformes. Dans G. D. Nguyen. À paraître

Nieuwland, S., & Van Melik, R. (2020). Regulating Airbnb: how cities deal with perceived negative externalities of short-term rentals. Dans Current Issues in Tourisme, Volume 23 (pp. 811-825).

Onopia. (2018, février 2). Étude du modèle d’affaires Airbnb. Récupéré sur Slideshare:

Business Model d'AirBnB from Onopia

OpenProject. (s.d.). Récupéré sur https://www.openproject.org

Osterwalder, A., & Pigneur, Y. (2010). Business Model Generation.

O’Sullivan, F. (2019, mai 17). ‘Fairbnb’ Wants to Be the Unproblematic Alternative to Airbnb. Récupéré sur CityLab: https://www.bloomberg.com/news/articles/2019-05-17/fairbnb-s-community-friendly-approach-to-tourism

Petruzzia, M. A., Marquesa, C., & Sheppard, V. (2021). TO SHARE OR TO EXCHANGE: An analysis of the sharing economy characteristics of Airbnb and Fairbnb.coop. International Journal of Hospitality Management.

Pipame. (2015). Typologie de cinq profils de particuliers demandeurs et offreurs collaboratifs. Dans Pipame : enjeux et perspectives de la consommation collaborative (p. 219). Martine Automme, Nicole Merle-Lamoot.

Pouly, J. (2016). Semaine 4, partie 3 : Construire un cadre sût, équitable et stimulant. Dans MOOC Comprendre l’économie collbaorative.

Rédaction. (2019, mai 19). Le surtourisme : quel impact sur les villes et sur l’environnement ? Récupéré sur Vie publique: https://www.vie-publique.fr/eclairage/24088-le-surtourisme-quel-impact-sur-les-villes-et-sur-lenvironnement

Skål International. (2020). SKÅL INTERNATIONAL SUSTAINABLE TOURISM AWARDS 2020. Récupéré sur https://skal.org/web/content/618869

Steck, B., Strasdas, W., & Evelyn, G. (2000). Titre Le tourisme dans la coopération technique: un guide pour la conception, la planification et la réalisation de mesures d'accompagnement destinées aux projets de développement rural et de conservation. GTZ.

Stergiou, D. P., & Farmaki, A. (2019). Resident perceptions of the impacts of P2P accommodation: Implications for neighbourhoods. Internal Journal of Hospitality Management.

Tirole, J. (2016). Économie des biens communs. Paris: Odile Jacob.

Van Alstyne, M., Choudary, S., & Parker, G. (2016). Platform Revolution: How Networked Markets Are Transforming the Economy and How to Make Them Work for You. New York: W. W. Norton & Cie.

Wikicréa. (2019, mai 31). Le canevas de proposition de valeur : définition, exemple et modèle Pwt. Récupéré sur Wikicréa: https://www.creerentreprise.fr/canevas-proposition-valeur-definition-exemple-modele/

Wikipedia. (s.d.). Resource-based view. Récupéré sur Wikipedia: https://en.wikipedia.org/wiki/Resource-based_view#Resources

Williams, N. (2021, octobre 21). Insider tips for the best things to do in Italy . Récupéré sur Lonely Planet: https://www.lonelyplanet.com/articles/top-things-to-do-in-italy

Zee, R. v. (2019, novembre 13). Fairbnb.coop launches, offering help for social projects . Récupéré sur The Guardian: https://www.theguardian.com/travel/2019/nov/13/fairbnbcoop-holiday-rental-website-launches-help-social-projects

Zervias, G., & David, P. (2016). The rise of the sharing economy: estimating the impact of Airbnb on the hotel industry.

Annexes

Tableau 1 : Tableau comparatif de Airbnb et Fairbnb

Paris sportifs Football

Comment maximiser ses gains sur les sites de paris sportifs ?

Par Aline BENABBOU, Gaspard CANEVET, Rida ENNAMIRI et Amaury TISSEAU, étudiants du parcours Data Science de IMT Atlantique.

Né au milieu du XIXe siècle, le football est aujourd’hui le sport le plus populaire et le plus médiatisé au niveau mondial, étant pratiqué par plus de 270 millions de personnes. Ce sport met en jeu des sommes d’argent colossales avec notamment l’essor des sites de paris sportifs. En 2019, le football concentrait 2,75 milliards d’euros de mises contre 415 millions en 2012 d’après AuStade. L’appât du gain est le premier facteur de motivation pour les parieurs, qui se creusent la tête pour prédire l’issue des matchs. Mais avec toutes ces statistiques et données liées au Football, ne serait-il pas possible d’être meilleur que l’instinct du parieur à l’aide des outils de Data Science ?

Business understanding

Dans un premier temps, nous allons vous expliquer le fonctionnement des paris sportifs de football. La cote est l’élément central du pari. C’est un nombre supérieur à 1.01 qui va caractériser à la fois les gains potentiels du parieur mais aussi la certitude du pari (certitude = (1/cote)*100). En effet, lorsque le parieur va miser sur la victoire de l’équipe B, les gains potentiels du parieur seront cote(Victoire équipe B)*mise. De plus, plus la cote est élevée, plus le pari est dangereux. Prenons un exemple :

Le Vendredi 11/12/2020 à 21h aura lieu le match St-Etienne contre Angers. Ce match comporte trois issues. Soit St-Etienne gagne, soit Angers gagne, soit les deux équipes se quittent sur un match nul.

Nous pouvons donc observer les trois cotes :

cote de 2.40 pour St-etienne gagnant
cote de 3.30 pour le match nul
cote de 2.60 pour Angers gagnant

Ainsi si :

Vous décidez de parier 10€ sur la victoire de St Etienne, votre gain potentiel s’élève à 24€.
Vous décidez de parier 10€ sur le nul, votre gain potentiel s’élève à 33€.
Vous décidez de parier 10€ sur la victoire d’Angers, votre gain potentiel est de 26€.

Enfin, ces trois cotes nous renseignent sur la certitude des paris. Parionssport estime que :

St Etienne a 42% (100/2,40) de chance de gagner.
Angers a 38% de chance de gagner.
il y a 30% de chance que les deux équipes se quittent sur un match nul.

Dans un deuxième temps, laissez nous vous expliquer comment les cotes des paris sportifs sont calculées. Pour ce faire, les entreprises de paris embauchent des bookmakers. C’est eux qui vont définir les cotes, en se basant sur des critères variés (dynamique de l’équipe, joueurs présents sur la feuille de match…) afin de caractériser la certitude du pari. Ces derniers prennent également une marge, en diminuant légèrement la cote annoncée par rapport à celle calculée. C’est ainsi que les sites de paris font leur chiffre. Cependant, les bookmakers ne sont pas les mêmes pour chaque plateforme de paris. C’est pourquoi les cotes diffèrent en fonction du site sur lequel on décide de parier.

Une mise en situation

Paul est un fan de l’équipe de Toulouse, et mise toujours sur cette équipe sur Betclic lorsque celle-ci joue, et quelle que soit sa cote. Il croit en son équipe favorite, et se dit qu’un jour il touchera le gros lot, mais pourtant il continue inlassablement de perdre de l’argent sans savoir quelles sont ses chances de réussite.

Comment peut-il savoir pour quelle équipe parier afin de maximiser ses chances ? Pourquoi ne pas parier sur un autre site que Betclic ?

Proposition de valeur

Nous proposons aux parieurs de maximiser leurs gains sur les matchs de Ligue 1, en faisant des prédictions sur l’issue de matchs à l’aide de modèles de Machine Learning. Nous donnons ainsi au parieur une prédiction sur chaque match, ainsi que des pourcentages de certitudes sur les différentes issues. Enfin, nous comparons et présentons les cotes des différents sites de paris au parieur, afin qu’il choisisse au mieux sur quel site parier.

Comment évaluerons-nous la fiabilité de notre modèle ?

Nous simulerons sur une saison nos gains en suivant à la lettre les prédictions de nos modèles, avec les cotes correspondantes récupérées dans un dataset archivant ces dernières (site de pari Bet365).

Et concrètement ?

a. Nos datasets

Nous utilisons plusieurs datasets.

Les datasets initiaux concernent les caractéristiques des différents matchs de la Ligue 1 entre les saisons 1993/1994 et aujourd’hui : issue du match, issue du match à la mi-temps, nombre de tirs/tirs cadrés, nombre de corners de chaque équipe, nombre de fautes commises par chaque équipe, etc.

Avec ces datasets initiaux, nous décidons de créer une nouvelle feature dynamique d’une équipe, avec un score allant de -3 à +3. Par exemple, une équipe qui a gagné ses 3 derniers matchs à l’extérieur aura une dynamique extérieure de +3.

Également, nous prenons en compte 3 paramètres extérieurs récupérés sur d’autres sites :

le budget d’une équipe par saison car, une équipe avec un gros budget aura peut-être tendance à gagner plus souvent ses matchs.
les scores du jeu vidéo Fifa de chaque équipe en fonction des saisons car, les équipes changent entre chaque saison. Ce score, donné par des spécialistes, est souvent une bonne approximation du niveau actuel de l’équipe. Nous utilisons les scores FIFA qui donnent les capacités offensives, défensives et de milieu de terrain des équipes. Une forte attaque contre une défense faible peut être un bon indicateur de victoire. Au contraire, deux fortes défenses avec des attaques moyennes peuvent indiquer une plus forte probabilité de match nul !

Le public moyen pour chaque équipe car, nous remarquons que les équipes à domicile ont tendance à marquer plus de buts. De même, les équipes extérieures sont plus sujettes à prendre un carton jaune ou rouge. Ces deux observations peuvent être expliquées par un public plus présent à domicile, qui donne son appui pour l’équipe à domicile et fait pression sur l’équipe extérieure.

b. Vers un grand nettoyage

Seuls les datasets de la saison 2007/2008 à aujourd’hui possèdent toutes les informations importantes pour trouver l’issue d’un match (fautes, corners…). Nous éliminons donc les datasets de la saison 1993/1994 à la saison 2006/2007.

De plus, entraîner nos algorithmes sur une saison x pour les tester sur la saison supérieure à x+4 n’est pas pertinent : la composition des équipes change, de nouvelles équipes entrent dans la Ligue 1 tandis que d’autres en sortent.

Nous décidons donc d’entraîner nos algorithmes sur les saisons 2015/2016 et 2016/2017 et de les tester sur la saison 2017/2018.

c. Pour une bonne préparation des datasets

Afin de pouvoir utiliser nos datasets, il faut les préparer. Nous ajoutons aux datasets initiaux les features budget, public et scores Fifa, ainsi que la dynamique d’une équipe.

Ensuite, nous modifions certaines features afin qu’elles puissent être utilisables par les algorithmes. Un exemple concret :

Nous éliminons les features « HomeTeam » et « AwayTeam » donnant le nom des équipes.

d. Sans oublier la récupération des cotes des sites de paris sportifs

Notre but final étant de permettre au parieur de maximiser ses gains, nous récupérons les cotes de plusieurs sites de paris avec du web scrapping afin de les utiliser pour vérifier la fiabilité de notre modèle.

En route vers le machine learning!

a. Un problème de classification

Qu’est ce qu’un problème de classification ? En clair, il s’agit de prédire la valeur d’un attribut (ici le résultat d’un match) à partir des valeurs de ses autres caractéristiques (résultat à la mi-temps, public présent pour l’équipe, etc).

b. Direction les algorithmes

Nous séparons notre dataset en deux : la première partie sert à entraîner nos algorithmes et la deuxième partie sert à les tester. Nous utilisons les datasets des saisons 2015/2016 et 2016/2017 pour entraîner nos modèles, et les testons sur la saison 2017/2018.

En comparant différents algorithmes sur nos datasets initiaux, nous nous rendons compte que le Random Forest est celui qui donne les résultats les plus convenables, en termes de score mais aussi de répartition des prédictions.

Devons-nous utiliser toutes les nouvelles features ?

Nous nous rendons compte que la combinaison des features ‘budget’ et ‘public’ aux datasets initiaux donne la meilleure prédiction, avec un score moyen de 0.54.

c. Fiabilité de notre modèle

Le but est de conseiller au mieux le parieur. Pour cela, nous devons nous assurer de la fiabilité de notre modèle. Nous montrons au parieur le pourcentage de certitude de chacune des issues d’un match, lui permettant d’évaluer le taux de confiance d’une prédiction.

Pour évaluer notre modèle, nous récoltons les cotes de la saison 2017/2018 du site Bet365 et nous simulons nos gains sur cette saison en misant 10 euros sur chaque pari.

Dans 9 cas sur 10, nous récupérons de 2 à 10% de la somme misée au total sur l’année. Mais le seul cas où l’on perd de l’argent nous montre que notre modèle n’est pas encore assez certain.

Si le projet voit le jour…

Si le projet se concrétise, plusieurs points sont à prendre en compte. Tout d’abord il faut penser aux coûts de structure :

maintenance et gestion de la plateforme et de l’algorithme de prédiction
contrats pour l’utilisation des données sur les équipes
salariés permanents
coûts marketing

Pour contrer ces coûts, il nous faut des sources de revenu, qui peuvent être un abonnement avec un compte pour avoir accès aux prédictions et conseils, la revente des données clients ou encore des publicités sur les sites web.

Enfin, nous devons penser aux aspects juridiques de notre projet, notamment au respect des normes RGPD car nous utilisons les données des sites de paris sportifs qui ne peuvent être utilisées à des fins commerciales.

Références bibliographiques

Datasets initiaux: https://www.football-data.co.uk
Scores FIFA: http://fifaindex.com/fr/teams.com/fr/teams
Public moyen: http://transfermarkt.com
Budget des clubs: http://sportune.fr
Chiffres clés sur le football: https://www.parieur-gagnant.com/chiffres-paris-france-infographie/
Droit de la donnée: https://moodle.imt-atlantique.fr/pluginfile.php/28479/mod_resource/content/1/IMT%20-%20Software%20Ecology%2020171108_BJean.pdf
Machine Learning Random Forest: https://moodle.imt-atlantique.fr/mod/resource/view.php?id=27571
Repo github pour les plus curieux : github.com/Amaurytiss/FootballPrediction
Rapport détaillé :

Rapport-technique-Télécharger

Qui sommes-nous ?

Aline Benabbou : www.linkedin.com/in/aline-benabbou-177584196/
Gaspard Canevet : www.linkedin.com/in/gaspard-canevet/
Rida Ennamiri : www.linkedin.com/in/rida-ennamiri
Amaury Tisseau : www.linkedin.com/in/amaury-tisseau-24749a204/

Entreprise	Points communs avec StudyAdvisor	Différences avec StudyAdvisor	Positionnement sur le marché
Imagine ton futur : propose des tests d’orientation	-S’adresse aux lycéens -On y retrouve une page dédiée aux organismes de formations	-Tests d’orientations -Articles plus généraux sur des filières ou diplôme
Inspire : site labellisé par l’Etat, propose à des étudiants d’orienter les lycéens.	-Etudiants qui donne leurs avis sur leur formation	-Mise en avant des types de formations et pas des organismes
Futurness : site de l’étudiant qui propose des tests pour mieux se connaître.	-Annuaire de formations -chatbot	-Tests d’orientations -Propose des appels par des personnes formées en tant que conseillers d’orientations. -S’adresse à tous les jeunes du collégien aux jeunes actifs.
Pixis : Chatbot qui propose une expérience personnalisée	-Chatbot	-Rôle de conseiller d’orientation avec une personnalisation forte.
Les salons de l’orientation	-Physique -Les étudiants donnant leurs expériences ne sont pas rémunérés. – 1 ou 2 salons pertinent dans l’année.	-Expériences d’étudiants de l’école, possibilité de poser des questions. -Plusieurs écoles au même endroit -gratuité (de manière générale)
Diplomeo : annuaire des formations	-Expérience personnalisée -Pas de communauté	-Présentation des formations -Gratuité
Les conseillers d’orientation	-Payant -Pas de témoignage de la formation	-Expérience personnalisée