Les déterminants de la probabilité du défaut de remboursement de crédit dans les IMF:Cas de la...

34
Page 1 of 34 ANALYSE DES DÉTERMINANTS ET DE LA PROBABILITÉ DE DÉFAUT DE REMBOURSEMENT DE CRÉDIT DANS LES IMF D’UVIRA : CAS DE MECRE UVIRA Paper submitted for consideration in the Bukavu Journal Of Economics and Social Sciences MATABARO BORAUZIMA Luc MUGISHO MUNKWA Guershom Assistants de recherche Faculté des Sciences Economiques et de Gestion Université Evangélique en Afrique Soumis en octobre 2013

Transcript of Les déterminants de la probabilité du défaut de remboursement de crédit dans les IMF:Cas de la...

Page 1 of 34

ANALYSE DES DÉTERMINANTS ET DE LA PROBABILITÉ DE

DÉFAUT DE REMBOURSEMENT DE CRÉDIT DANS LES IMF

D’UVIRA : CAS DE MECRE UVIRA

Paper submitted for consideration in the Bukavu Journal Of Economics

and Social Sciences

MATABARO BORAUZIMA Luc

MUGISHO MUNKWA Guershom

Assistants de recherche

Faculté des Sciences Economiques et de Gestion

Université Evangélique en Afrique

Soumis en octobre 2013

Page 2 of 34

Objectif :

L’objet de ce papier est d’une part d’identifier les principaux déterminants de défaut de

remboursement et sa probabilité d’autre part à la MECREUVIRA.

Méthodologie :

Après une revue de littérature sur les différents déterminants du défaut de remboursement ainsi

que sa probabilité, nous avons fait recours d’un coté à l’analyse discriminante linéaire pour

mettre en place une fonction score permettant de différencier les bons et les mauvais

emprunteurs et de l’autre coté à la régression logistique qui permet de dégager les

déterminants de défaut ainsi que sa probabilité de survenance.

Résultats :

- Les résultats du test de comparaison des moyennes des bons et mauvais emprunteurs

indiquent une différence significative entre eux.

- Le test de normalité de Shapiro-Wilk et celui d’égalité de la matrice des covariances

entre les deux groupes indiquent que les hypothèses d’application du credit scoring

sont valides pour nos données.

- La fonction discriminante établie est départ les différents test de validité est

significativement performante que le hasard pour reclasser correctement les emprunteurs.

- Le type de prêt accordé et l’activité de l’emprunteur influencent significativement le

défaut de remboursement.

- Le test LR permet de rejeter la nullité des coefficients du modèle logistique en faveur

d’une significativité globale.

Originalité :

Le présent est innovant car il s’agit d’un premier effort empirique dans la région qui essaie

de combiner à la fois les déterminants du risque de crédit et les possibilités de savoir qui est

bon ou mauvais emprunteur avant d’accorder le crédit.

Mots clés : Credit scoring, défaut de remboursement, analyse discriminante, risque de

crédit, emprunteur.

Page 3 of 34

1. INTRODUCTION

Les institutions de micro-finance(IMF) sont présentes dans le système financier pour

servir d’intermédiaires entre les fournisseurs de capitaux dits agents à capacité de financement

et les utilisateurs de ces capitaux dits agents a besoin de financement. En amont elles récoltent

les dépôts des particuliers et en aval elles les distribuent aux personnes qui désirent financer soit

leurs projets, soit financer leurs besoins en fonds de roulement etc. cette dualité dans le sens

d’agir, fait naître dans les activités des IMF une multitude de risques notamment le risque de

marché, le risque d’option, le risque de crédit, le risque opérationnel, etc.

La crise financière qui secoue le monde actuellement, notamment les défaillances

successives des grandes banques internationales (Lehman Brothers aux Etats-Unis par exemple)

ont remis sur le devant de la scène la problématique des risques bancaires dont le risque crédit

A. ELMMAHA (2009).

En plus, les implications de la crise financière et les conséquences des asymétries

d’information sont globales. Au niveau local, elle se manifeste par la baisse de la performance

des institutions de microfinance et les banques. Ainsi, par l’exemple, les états financiers de la

MECRE/UVIRA indiquent un accroissement significatif du taux de portefeuille à risque. ce

taux varie selon les statistiques entre 10 et 30%1.

Ainsi, depuis les dernières décennies, des études ont été conduites et leurs les résultats

donnent la possibilité de réduire ledit risque à travers des outils statistiques qui permettent

d’identifier les déterminants du défaut de remboursement et d’en prévoir la probabilité de

survenance.

C’est sous cet angle que B. DIALLO (2006) développe un modèle de crédit scoring

pour une institution de microfinance au Mali. Utilisant un échantillon de 269 emprunteurs

individuels, l’auteur montre l’importance de la relation de long terme, du taux d’intérêt, des

1 RAPPORT D’AUDIT FINANCIER MECRE/UVIRA, 2011

Page 4 of 34

coûts des transactions et du rationnement dans la prédiction du défaut de remboursement. En

outre, le modèle mis en place affiche un pouvoir distinctif entre les bons et les mauvais

emprunteurs.

A ELHAMMA (2009) applique la méthode de crédit scoring à la Banque Populaire

de Rabat-Kénitra. En utilisant un échantillon de taille 46 clients et en suivant les différentes

étapes de la méthode, les résultats permettent de mettre en place une fonction score qui s’avère

être robuste pour distinguer les mauvais et les bons emprunteurs.

Par ailleurs, P. BOISSELIER et D. DUFOUR (2003) présente un article sur le

scoring et anticipation de défaillance des entreprises par l’approche de la régression

logistique. Appliquant une technique de régression logistique pour les travaux de la Banque

de France, pour les entreprises saines et faillies en 2002, ils trouvent des résultats significatifs

leur et proposent un modèle de prévision.

Dans le même ordre d’idées, la présente étude vise à examiner les différents facteurs

explicatifs du défaut de remboursement du crédit et la prévision du risque de crédit lié à un

emprunteur, par deux types de méthodes, en l’occurrence l’analyse discriminante et la

régression logistique et ce à la MECRE/UVIRA.

Les questions principales suivantes guideront notre réflexion tout au long de ce travail :

Quelles sont les principaux déterminants du défaut de remboursement à la mutuelle d’épargne et

de crédit d’Uvira ? En plus, quelles sont les variables qui permettent de différencier les bons de

mauvais emprunteurs ? Eu égard aux questions posées précédemment dans notre problématique,

nous pouvons anticiper que les principaux déterminants de défaut de crédit à la MECRE/UVIRA

seraient le montant du crédit octroyé, l’ancienneté dans l’activité exercé, le niveau d’étude du

demandeur de crédit, le taux d’intérêt pratiqué, le degré de rationnement ; que le montant du

crédit demandé serait la principale variable pouvant discriminer les bons de mauvais

emprunteurs ;

Comme nous l’avons signalé dans les lignes précédentes, nous allons identifier

l’influence des caractéristiques des clients sur le défaut de crédit, la capacité et la qualification

Page 5 of 34

du client qui influent sur la décision d'octroi du crédit et la prédiction du risque de non

remboursement de crédits octroyé aux clients.

Il faut signaler que la présente étude s’inspire de l’étude menée par DIALLO (2006) au Mali

dans le secteur de Microfinance. En la différence de ce dernier, notre étude s’applique au

niveau local en dépit du fait que les variables utilisées sont similaires.

Ce travail analyse les déterminants du défaut de remboursement et gestion de risque de crédit

au sein de la MECRE-UVIRA au courant de l’année 2010. La MECRE-UVIRA est située à

l’Est de la République Démocratique du Congo, dans la province du Sud-Kivu, dans le territoire

d`UVIRA, Avenue Patrice Emery Lumumba à MULONGWEen face de shop VODACOM.

Du point de vue de l’architecture, ce travail comprend, introduction et conclusion mises à

part, une revue de littérature qui présente à la fois une approche théorique et empirique

renchérissant le travail, une partie méthodologique qui permet de comprendre la démarche

scientifique utilisée pour corroborer les hypothèses émises, et enfin une partie sur les résultats

et la discussion qui permet confronter nos résultats à ceux des travaux antérieurs afin d’en

dégager des conclusions cohérentes.

2. REVUE DE LA LITTERATURE

a. Revue de littérature théorique

a.1. Risque de Crédit

Plusieurs auteurs définissent le risque de crédit différemment.

Pour FAYE(1993), le risque de crédit est défini comme étant le risque de perdre tout ou une

partie des créances au cas où l’emprunteur n’aurait plus à l’échéance la volonté ou la possibilité

d’honorer ses engagements.

Pour DEMAZY(2000), le risque de crédit est le risque auquel est exposée une

institution de crédit dans le cas où un emprunteur se relèverait incapable de respecter ses

engagements. C’est- à dire le risque de non remboursement de la créance ou de non paiement

des intérêts de la créance. Ce risque renvoie au changement de la valeur du portefeuille de

Page 6 of 34

crédit résultant de l’incapacité réelle ou perçue de l’emprunteur à respecter tout ou partie du

contrat envers le prêteur.

Pour CAMARA(2006), le risque de crédit se définit comme la probabilité de non-

paiement du crédit octroyé à un client ou membre de l’IMF pour une raison quelconque.

C’est donc le risque de non remboursement des crédits des IMF.

Quant à DESMICHT(2004), il définit le risque de crédit comme étant le risque de

perte en cas de défaillance de l’emprunteur. Il s’agit du risque d’impayé ou du risque de

défaut.

Le risque de crédit est le plus connu et constitue la plus grave des vulnérabilités d’une

institution de microfinance. C’est la détérioration de la qualité du portefeuille crédit qui cause

les pertes et créée des charges énormes en gestion de la défaillance. Ce risque aussi connue

comme le risque de défaillance, est lié à l’incapacité du client de respecter les termes du

contrat de prêt.

Ainsi, CARE International(2001), définit le risque de crédit comme étant la détérioration

de la qualité du portefeuille de crédit qui cause les pertes et des charges énormes en

gestion de la défaillance, est lié à l’incapacité du client ou membre de l’IMF pour une

raison quelconque .C’est donc le non remboursement des crédits des IMF.

Le Credit Scoring peut être globalement défini comme un ensemble de modèles de

décision et les techniques sous-jacentes qui aident les prêteurs dans la décision d’octroi des

crédits de consommation. Il est principalement utilisé par les banques formelles des pays

développés pour prédire la probabilité de défaut sur les crédits individuels de consommation.

Même si l’application du Credit Scoring est vieille de plus de soixante ans, il convient de

signaler qu’il est relativement nouveau pour la micro-finance notamment dans les pays en

développement (Schreiner, 2004). Ceci peut s’expliquer par plusieurs raisons dont la nécessite de

disposer de données en quantité suffisante et de bonne qualité, la technologie etc.

Page 7 of 34

Un des premiers modèles de Credit Scoring dans un contexte africain fut développé par

Viganò pour la Caisse Nationale du Crédit Agricole (CNCA) du Burkina Faso (Viganò, 1993).

En faisant usage d’un échantillon plus important, Schreiner (2004) a développé un modèle de

Scoring pour une IMF bolivienne.

A en croire DIALLO(2006), très peu d’études ont été menées sur le Scoring dans le

domaine de la micro-finance dans les pays en développement. L’objectif principal de cette

recherche est de développer un modèle de Credit Scoring pour une institution de micro-finance à

la MECRE, en utilisant les crédits individuels.

Le Credit Scoring est le processus d’assignation d’une note (ou score) à un emprunteur

potentiel pour estimer la performance future de son prêt (Flaman, 1997).

Le Credit Scoring utilise des mesures quantitatives de performance et les caractéristiques des

prêts précédents pour prédire performance des prêts futurs avec des caractéristiques similaires.

Le Credit Scoring n’approuve, ni ne rejette une demande de prêt, il peut plutôt prédire la

probabilité d’occurrence de mauvaise performance (défaut) telle que définie par le préteur (Caire

et Kossmann, 2003).

Le Credit Scoring constitue un ensemble de modèles de décision et les techniques sous-jacentes

qui aident dans la décision d’octroi des crédits de consommation (Thomas et al. 2002).

En résumé, on peut dire que le Credit Scoring est outil de gestion de risques qui vise à

prédire la probabilité de défaut d’un nouveau prêt en utilisant les prêts précédents. Ainsi,

l’objet du Credit Scoring est de prédire le risque et non de l’expliquer; il est toutefois

important d’analyser les facteurs important permettant de discriminer entre bons et mauvais

prêts.

b. Revue de littérature empirique

Plusieurs auteurs ont déjà travaillé sur l`application de la méthode de Credit Scoring,

pour les microfinances ainsi que pour les banques en Afrique.Voici dans les lignes qui suivent,

les principaux résultats obtenus à partir de leurs études :

Page 8 of 34

Hamadi Matoussi et al. (2004) dans une portant sur le risque de non remboursement des crédits

de gestion par une banque commerciale Tunisienne montre que , la maîtrise du risque de défaut

des crédits est devenue l'un des axes stratégiques majeurs de la gestion des organismes bancaires.

Son objectif était de comparer le pouvoir prédictif de deux méthodes d’analyse du Credit

Scoring pour la prévision du risque de défaut à savoir : la régression logistique et les réseaux de

neurones artificiels. Il a utilisé une base de données composée de 1435 dossiers de crédit

octroyés aux entreprises industrielles tunisiennes en 2003, 2004,2005 et 2006. Les résultats

montrent la supériorité des réseaux de neurones artificiels par rapport aux autres méthodes

classiques en matière de détresse financière des firmes emprunteuses. Dans ce sens, ils ont

obtenu un taux de bon classement global de 97% pour l’échantillon d’apprentissage et 89.9%

pour l’échantillon test.

De plus Boubacar DIALLO (2006), développe un modèle de Crédit Scoring en utilisant

un échantillon de 269 emprunteurs individuels de l’institution de micro-finance Nyèsigiso au

Mali. Les résultats ont montré l’importance de la relation de long terme, du taux d’intérêt, des

coûts de transactions et du rationnement dans la prédiction du défaut de remboursement. Le

modèle qui a été développé à partir de la régression logistique et de l’analyse discriminante,

prédit correctement dans plus 70% des cas. L’analyse des cas de rejets a montré une certaine

cohérence entre les prédictions du modèle et les décisions de rejet de l’institution.

Aimé TCHUMKAM Césaire(2008) s'intéresse à la pertinence de traitement des dossiers (un

échantillon de 109 emprunteurs) à travers des outils statistiques et économétriques (test de khi

deux, analyse factorielle, analyse discriminante, régression logistique) tiré de la direction du

crédit et du contrôle des engagements (DCCE) de la banque permettant l'octroi des crédits aux

différents clients. Cela passe nécessairement par une étude du marché du crédit bancaire,

l'examen complet des informations financières du dossier de l'emprunteur, et des tests à

apprécier.

A ELHAMMA (2009) applique la méthode de crédit scoring à la Banque Populaire de

Rabat-Kénitra. En utilisant un échantillon de taille 46 clients et en suivant les différentes

étapes de la méthode, les résultats permettent de mettre en place une fonction score qui s’avère

être robuste pour distinguer les mauvais et les bons emprunteurs.

Page 9 of 34

3. METHODOLOGIE

3.1. Choix de la taille de l’échantillon

La population cible de l’étude était constituée par les clients de la MECRE/UVIRA.

L’étude n’a pas été menée sur tous les clients de la MECRE/UVIRA faute de l’accessibilité à toute la

base de données. Nous avons eu accès à uniquement 100 dossiers de demande de crédit(dont 94 dossiers

acceptés et 6 dossiers rejetés) sur les 400 enregistrés au courant de l’année. Parmi les 94 clients, 25 ont

fait défaut (mauvais clients) et 69 ont honoré leurs promesses(bon clients)2.

3.2. Définition des variables

Variables Définition

Age Age de l’emprunteur +

Sexe Sexe de l’emprunteur /

Exp Nombre d’année d’expérience dans l’activité -

Cont Année de contact avec la MECRE -

Md Montant du crédit demandé +/

Mr Montant de crédit reçu +/

Dera (Montant de prêt demandé-Montant de prêt réellement

reçus) / Montant de prêt réellement reçu.

Ceci indique le degré de rationnement

-

Ec Le nombre de jours entre la date de demande du crédit et

la date de réception du crédit

+

VGa Valeur estimée du bien donné en garantie -

Tx Taux d’intérêt +

Cf Montant de conditions financières +

Np Nombre de prêts reçus par le membre depuis son

Adhésion à la coopérative

+/

2 Nous avons retenu la définition suivante de « bons » et « mauvais » : un bon client est celui ayant remboursé la

totalité du crédit demandé dans un délai de moins de 90 jours. Dans le cas contraire, le client est qualifié de mauvais

Page 10 of 34

3.2. L’analyse discriminante

L’analyse discriminante est utile pour étudier des données lorsque la variable dépendante est

nominale et que les variables explicatives ou indépendantes sont quantitatives. Elle est connue

sous le nom d’analyse discriminante à deux classes, lorsque la variable dépendante possède deux

classes, elle est dite multiple dans le cas où au il ya moins trois classes.

L’analyse factorielle discriminante ou analyse discriminante est une technique statistique qui

vise à décrire, expliquer et prédire l’appartenance à des groupes prédéfinis (classes, modalités de

la variable à prédire, …) d’un ensemble d’observations (individus, exemples, …) à partir d’une

série de variables prédictives (descripteurs, variables exogènes, …).

Une analyse discriminante se déroule en cinq étapes suivantes :

1. La formulation du problème

La première étape consiste à formuler le problème en identifiant les objectifs, la variable

dépendante et les variables indépendantes. La variable dépendante doit comprendre deux ou plus

de deux classes mutuellement exclusives et collectivement exhaustives. Quand la variable

dépendante est échelonnée par intervalles, elle doit d’abord être convertie en classes.

Alternativement, il est possible de représenter graphiquement la variable dépendante et de former

des groupes égaux en taille en déterminant les bonnes frontières pour chaque classe. Les

variables explicatives doivent être sélectionnées à partir d’un modèle théorique ou de recherches

antérieures, ou, dans le cas d’une étude exploratoire, en se fondant sur le jugement du chargé

d’études.

L’étape suivante consiste à diviser l’échantillon en 2 parties. L’une, appelée échantillon

d’analyse ou d’estimation, est utilisée pour l’estimation de la fonction discriminante. L’autre,

appelé l’échantillon de contrôle est réservé pour la validation de la fonction discriminante.

Quand l’échantillon est assez grand ; il peut être divisé en deux moitiés, dont l’une sert

d’échantillon d’analyse et l’autre à la validation. Les rôles de deux moitiés sont en suite

interchangés et l’analyse est réitérée. Cette méthode appelée double validation croisée, est

analogue à celle proposée dans l’analyse par régression. Souvent, la distribution du nombre

d’individus dans l’échantillon d’analyse et de validation suit celle de l’échantillon total. Faute de

Page 11 of 34

l’accès à toute la base de données de la MECRE/UVIRA, nous n’avons pas pu constituer un

échantillon de validation.

En fin, il a été suggéré que la validation de la fonction discriminante devrait être menée à

plusieurs reprises. A chaque fois, l’échantillon devrait être fractionné entre les deux parties

d’analyse et de validation, la fonction discriminante estimée est l’analyse de la validation menée.

L’évaluation de la validation devrait donc être fondée sur un certains nombres d’essais. Des

méthodes pour estimer les coefficients rigoureuses ont aussi été avancées.

2. Estimation des coefficients de la fonction discriminante

Une fois que l’échantillon d’analyse a été identifié, il est possible d’estimer les coefficients de la

fonction discriminante. Deux grandes approches existent. La méthode directe réalise l’estimation

de la fonction discriminante de telle façon que toutes les variables explicatives soient incluses

simultanément, et que chaque variable indépendante le soit également, quel que soit son pouvoir

discriminant. Cette méthode est adaptée lorsque, à partie de recherches antérieures ou d’un

modèle théorique, le chargé d’études tient à ce que la discrimination soit fondée sur toutes les

variables explicatives. L’autre approche est l’analyse discriminante pas à pas, dans laquelle les

variables explicatives sont intégrées successivement, selon leur capacité de discrimination entre

les classes. Cette méthode convient dans le cas où le chargé d’études veut sélectionner un sous-

ensemble des variables explicatives à inclure dans la fonction discriminante. On peut obtenir une

appréciation intuitive des résultats de l’analyse grâce à l’examen des moyennes des catégories et

des écart-types.

3. La détermination de la signification de la fonction discriminante

Il n’y aurait aucun sens d’interpréter l’analyse si la fonction discriminante estimée n’était pas

statistiquement significative. L’hypothèse nulle que, dans la population, les moyennes de toutes

les fonctions discriminantes pour toutes les classes sont égales peut être statistiquement testée.

Sur SPSS, ce test s’appuie sur le λ de Wilks.

La validation croisée effectuée uniquement pour les individus participant à l’analyse. Chaque

individu est classé selon les fonctions déduites à partir des tous les autres individus excepté

celui- là.

Page 12 of 34

Si plusieurs fonctions sont testées simultanément (comme dans le cas de l’analyse discriminante

multiple), le λ de Wilks statistique est le produit du λ univarié pour chaque fonction. Le seuil de

signification est estimé à partir d’une transformation du khi-deux de la statistique. Aucun test de

signification n’est disponible sur munitab. Si l’hypothèse nulle est rejetée, ce qui indique une

discrimination significative, on peut alors procéder à l’interprétation des résultats.

4. L’interprétation des résultats

L’interprétation des poids ou des coefficients discriminants est comparable à celle de l’analyse

par régression multiple ; la valeur du coefficient pour une variable particulière dépend des autres

variables incluses dans la fonction discriminante. Le signes des coefficients sont arbitraires et

indiquent les valeurs des variables qui aboutissent à des valeurs de fonctions grandes et petites et

les associent à des groupes particuliers. Il est aussi possible d’interpréter les résultats de l’analyse

discriminante en développant un profil type pour chaque classe, en d’autres termes, en la

décrivant selon les moyennes pour chaque variable explicative. Si les variables explicatives

importantes ont été identifiées, une comparaison des moyennes par classe sur ces variables peut

alors faciliter la compréhension des différences entre les groupes. Cependant, avant que les

conclusions ne puissent être interprétées de façon sûre, il est nécessaire de valider les résultats.

5. L’évaluation de la validité de l’analyse discriminante

De nombreux logiciels, comme SPSS, offrent une option de validation croisée de classification

par élimination. Le modèle discriminant est réestimé autant de fois qu’il ya de personnes

interrogées dans l’échantillon. Chaque modèle réestimé exclut un individu de l’échantillon et sert

à prédire les données relatives à celui-ci. Quand on ne dispose pas d’un échantillon d’analyse

important, cette pratique donne une idée de la robustesse de l’estimation en utilisant chaque

individu, tour à tour, comme échantillon d’analyse.

Comme expliqué précédemment et lorsque c’est possible, les données doivent être divisées de

façon aléatoire en deux échantillons ; l’un, l’échantillon d’analyse, sert à estimer la fonction

discriminante ; l’autre sert à développer la matrice de confusion. Les coefficients discriminants,

estimés à partir de l’échantillon d’analyse, sont multipliés par les valeurs des variables

explicatives dans l’échantillon de validation pour générer des scores discriminants relatifs à ce

dernier. On affecte alors des classes aux individus à partir de leurs scores discriminants et d’une

Page 13 of 34

règle de décision adéquate. Par exemple dans l’analyse discriminante à deux classes, un individu

sera assigné à la classe dont le barycentre est le plus proche. Le pourcentage d’individus

correctement classés, peut alors être déterminé en additionnant les éléments de la diagonale,

divisés ensuite par le nombre total d’individus.

Il est utile de comparer le pourcentage d’individus correctement classés grâce à l’analyse

discriminante au pourcentage d’individus qui auraient été affectés aux classes par hasard. Quand

les classes sont de même taille, le pourcentage de classification aléatoire est 1, divisé par le

nombre de classes. Quelle amélioration doit-on attendre par rapport à une classification

aléatoire ? Il n’existe aucune règle générale, même si certains auteurs ont avancé que la précision

de la classification réalisée par l’analyse discriminante serait supérieure d’au moins 25% à celle

de la classification aléatoire.

La plupart des programmes d’analyse discriminante estiment aussi une matrice de confusion à

partir de l’échantillon d’analyse. Parce qu’ils capitalisent sur les variations aléatoires dans les

données, de tels résultats sont toujours meilleurs que ceux de la classification par élimination ou

ceux de la classification obtenue sur l’échantillon de la validation.

Le modèle utilisé a été emprunté à Boubacar Diallo(2006). Son modèle comprenait

seulement les variables : Nombre de jours entre la date de demande et de réception du prêt,

Nombre de prêts, FREQART( ratio valeur des conditions financières/Montant du prêt),

Dera(degré de rationnement) et le Taux d’intérêt.

Notre modèle de l’analyse discriminante est de la forme suivante :

Z= Score discriminant

ß1… ß5 = poids ou coefficients discriminants

Statistiques associées à l’analyse discriminante

VGaNpCfTxEc

DeraMrMdContExpAgZ

1110987

6543210

Page 14 of 34

Les valeurs Statistiques importantes associées à l’analyse discriminante sont les suivantes:

La corrélation canonique : Elle mesure l’étendue de l’association entre les scores discriminants

et les classes, entre la fonction discriminante unique et l’ensemble des variables dichotomiques

qui définissent la classe d’affectation.

Le barycentre : Barycentre ou centroïde, il représente les valeurs moyennes pour les scores

discriminants pour une classe particulière ? Il ya autant de barycentres qu’il ya des classes. Les

moyennes de toutes les fonctions pour une classe sont les barycentres de classe ;

La matrice de confusion : Appelée aussi matrice de classification, la matrice de confusion

contient le nombre d’individus correctement et incorrectement classés. Les premiers apparaissent

sur la diagonale, puisque les classes prédites et les classes réelles sont les mêmes. Les seconds ne

se trouvent pas sur la diagonale puisqu’ils n’ont pas été classés correctement. La somme des

éléments de la diagonale divisée par le nombre total de cas donne le hit ratio, le pourcentage

d’individus bien classés.

Les coefficients de la fonction discriminante (non standardisés) : sont les coefficients

multiplicateurs des variables, quand elles sont données dans l’unité de mesure d’origine.

Les scores discriminants : Les coefficients non standardisés sont multipliés par les valeurs des

variables. Ces produits sont additionnés puis ajoutés au terme constant pour obtenir les scores

discriminants.

La valeur propre : C’est le rapport entre la somme des carrés classe et des carrés interclasse,

pour chaque fonction discriminante. Les valeurs propres élevées correspondent à des fonctions

supérieures.

Les valeurs F et leur signification : Elles sont calculées à partir d’une ANOVA à un facteur,

avec pour variable nominale indépendante la variable de classement. Les variables explicatives

servent, l’une après l’autre, de variable dépendante dans l’analyse de la variance.

Les moyennes des classes et les écart-types : Ils sont calculés pour chaque variable explicative

et pour chaque classe.

Page 15 of 34

La matrice de corrélation intraclasses : Elle est réalisée à partir de la moyenne des matrices de

covariances pour chaque classe.

Les coefficients standardisés de la fonction discriminante : Ce sont les coefficients

discriminants de la fonction. Ils sont utilisés comme facteurs multiplicateurs quand les variables

ont été standardisées à une moyenne de 0 et à une variance de 1.

Les corrélations structurelles : Elles représentent les corrélations simples entre les variables

explicatives et la fonction discriminante.

La matrice de corrélation totale : Elle est obtenue lorsque les cas sont traités comme s’ils

provenaient d’un échantillon unique et que les corrélations sont calculées.

Le lambda de Wilks : Aussi appelé parfois statistique U, le λ de Wilks pour chaque variable

explicative est le rapport entre la somme des carrés intraclasses et la somme des carrés totales. Sa

valeur vraie entre 0 et 1. Des valeurs élevées de λ (proches de 1) indiquent que les moyennes des

classes ne semblent pas être différentes, alors que les valeurs faibles (proches de 0) indiquent

qu’elles semblent l’être.

Les hypothèses de l’analyse discriminante sont que chaque groupe est un échantillon extrait

d’une population multivariée normale et que toutes les populations ont la même matrice de

covariance. Le rôle de ces hypothèses ainsi que ces valeurs statistiques sont éclaircis lorsqu’on

étudie la méthode par laquelle on mène une analyse discriminante.

B. Régression logistique

La régression logistique est une technique statistique qui a pour objectif, à partir d'un

fichier d'observations, de produire un modèle permettant de prédire les valeurs prises par une

variable catégorielle, le plus souvent binaire, à partir d'une série de variables explicatives

continues et/ou catégorielles. La régression logistique recourt à l'approche du Maximum de

Page 16 of 34

Vraisemblance pour estimer les paramètres du modèle. Le terme d'erreur est supposé suivre une

distribution logistique.

Selon Hayden et Porath (2006), cette technique est intéressante puisqu'elle a l'avantage

d'être facile à utiliser et à comprendre. Elle comporte cependant deux problèmes majeurs. Le

premier concerne la variable expliquée qui est calculée. Comme la variable dépendante

recherchée est une probabilité, sa valeur doit être comprise entre 0 et 1. Lorsque la régression

linéaire est utilisée, les valeurs calculées pourraient être inférieures à 0 ou supérieures à 1. Et le

deuxième problème majeur?

Le remboursement du crédit est un phénomène « discret » correspondant à deux modalités : (i)

soit l’emprunteurrembourse le crédit demandé ou (ii) soit l’emprunteur fait défaut. Ce processus

de choix de nature déterministe est guidé par un certain nombre de facteurs, notés variables

explicatives (PALMA et THISSE, cité par BAHATI N., 2011).

Le modèle est donc constitué par une variable dépendante dichotomique (binaire) :

Soit Y,la variable remboursement du crédit.

Y=1 si l’emprunteur ne fait pas défaut, s’il rembourse le crédit en totalité et dans le délai(moins

de 30 jours pour notre cas) ;

Y= 0 si l’emprunteur fait défaut.

Pour traiter ce genre de modèle, l’estimation linéaire n’est pas appropriée (Doucouré, 2008 ; cité

par BAHATI N., 2011)dans la mesure où les valeurs prédites peuvent être en dessous de 0 et au

dessus de 1, ou comprises entre les deux (Kpodar, 2007 cité par BAHATI, 2011). En d’autres

termes, les informations relatives à ce type de choix ne peuvent pas être spontanément

ordonnées.

Dans la pratique, deux approches sont souvent utilisées pour croiser les réalisations de la

variable binaire (notée généralement par Y) avec celles d’un certain nombre de variables

explicatives Xjdont les réalisations peuvent être indifféremment de natures qualitative ou

quantitative : les modèles Logit et Probit. On suppose, à travers ces approches, que les valeurs

prises par les variables explicatives déterminent (à un alea près) celles d’une variable latente

(non observable) 𝑦𝑖∗ qu’on peut interpréter comme une propension à engendrer un événement de

type Yi = 1 :

Page 17 of 34

𝑦𝑖∗ = 𝛽′𝑋𝑗𝑖 + 𝜀𝑖

où β est un vecteur de paramètres associé au vecteur de variables explicatives X.

On suppose en outre que cet événement ou choix serait observé sous un certain seuil tel que Yi =

1 si y* > 0 etYi = 0 si y* < 0. En d’autres termes, ces approches ne modélisent pas la variable

dépendante elle-même, mais plutôt la probabilité qu’elle prenne la valeur 1 ou 0(ici la probabilité

que le client rembourse ou fasse défaut). On en déduit ainsi :

Pr(𝑌 = 1) = 𝐹(𝑋𝛽)

Pr(𝑌 = 0) = 1 − 𝐹(𝑋𝛽)

La différence entre les deux types d’approches (logit et probit) dépend de la forme de la fonction

de répartition F et/ou loi de répartition du terme de l’erreur.

Le modèle Logit est choisi lorsque la fonction de répartition F est une loi logistique. Dans ce

cas, la probabilité Pi est définie de la manière suivante :

𝑃𝑖 = 𝐹(𝑥𝑖′𝛽) =

𝑒𝑥𝑖′𝛽

1 + 𝑒𝑥𝑖′𝛽=

1

1 + 𝑒−𝑥𝑖′𝛽= ⋀(𝑥𝑖

′𝛽)

avec ⋀(𝑥𝑖′𝛽) =

1

1+𝑒−𝑥𝑖′𝛽

, la fonction de répartition et 𝑓(𝑥𝑖′𝛽) =

𝑒−𝑥𝑖′𝛽

(1+𝑒−𝑥𝑖′𝛽)

2, la fonction de densité.

La modèle Probit est choisi lorsque la fonction de répartition F est une loi normale centrée et

réduite. Dans ce cas, la probabilité Pi est définie de la manière suivante :

𝑃𝑖 = 𝐹(𝑥𝑖′𝛽) = ∫

1

√2𝜋𝑒−𝑥2

2⁄ 𝑑𝑡𝑥𝑖′𝛽

−∞

= Φ(𝑥𝑖′𝛽)

La fonction de densité de la loi normale centrée réduite N(0,1) est notée :

𝜙(𝑥𝑖′𝛽) =

1

√2𝜋𝑒−𝑥2

2⁄

Toutefois, ces deux modèles sont basés sur une même méthode d’estimation, à savoir

l’Estimateur du maximum de vraisemblance. En outre, leurs résultats sont souvent très proches3,

sauf dans quelques cas, notamment si l’échantillon contient très peu d’observations telles que

Y=1, ou très peu d’observations telles que Y =0.(BAHATI N., 2011).

3 Voir notamment Cadoret et alii (2004 ; p. 377) qui l’ont vérifié par une démonstration mathématique et graphique.

Page 18 of 34

Pour notre part, nous optons pour une méthode d’estimation fondée sur le modèle Probit, car on

suppose que la fonction de répartition est une loi normale en raison de la taille relativement plus

grande de l'échantillon.

Afin d’évaluer le risque de défaut, nous ferons recours à la régression logistique. Le

modèle utilisé est spécifié de la façon suivante :

4. RESULTATS ET DISCUSSIONS

A. Présentation des caractéristiques des emprunteurs

L’objectif principal de cette recherche est de développer un modèle statistique qui puisse

permettre de distinguer les bons emprunteurs des mauvais. Une des premières étapes est donc de

définir ce que nous nous entendons par bons et mauvais emprunteurs. Un emprunteur est

considéré comme bon s’il rembourse (ou a toujours remboursé) correctement son prêt et n’a

jamais été en retard de paiement pour trente (30) jours ou plus. Un mauvais emprunteur par

contre est un emprunteur qui a connu au moins une fois un retard dans le remboursement de son

prêt pour 30 jours ou plus. Ces définitions peuvent toutefois varier d’une institution à une autre

(Comité de Bâle cité par B. DIALLO, 2006).

C’est cette définition que nous avons retenu pour séparer les bons de mauvais

emprunteurs lors de l’encodage.

VGaNpCfTxEc

DeraMrMdContExpAgp

pogL

1110987

65432101

Page 19 of 34

Tableau 4.1. Statistiques descriptives pour bons et mauvais emprunteurs prix séparément

Bon ou mauvais emprunteur Moyenne Ecart-type

Mauvais emprunteur Age du demandeur de crédit 33,7 8,4

Années d'expérience dans sa profession 4,8 3,8

Année de contact avec MECRE UVIRA 2 008,9 0,7

Montant du crédit demandé 1 180,0 746,7

Montant du crédit reçu 1 123,4 803,5

Degré de rationnement 0,3 1,4

Nombre de jour entre les dates de demande et de réception

crédit 12,6 6,7

Taux d'intérêt pratiqué sur le prêt 2,8 0,4

Conditions financières 32,5 23,4

Nombre de prêts déjà reçu 1,7 0,6

Valeur du bien donné en garantie 4 444,0 8 866,9

Bon emprunteur Age du demandeur de crédit 40,3 9,2

Années d'expérience dans sa profession 9,3 7,0

Année de contact avec MECRE UVIRA 2 008,5 0,7

Montant du crédit demandé 1 578,3 1 051,7

Montant du crédit reçu 1 337,5 883,8

Degré de rationnement 0,2 0,9

Nombre de jour entre les dates de demande et de réception

crédit 18,4 19,7

Taux d'intérêt pratiqué sur le prêt 2,9 0,3

Conditions financières 39,1 25,8

Nombre de prêts déjà reçu 2,0 0,7

Valeur du bien donné en garantie 8 969,6 11 783,2

Source : Nos analyses avec SPSS

Pour les mauvais emprunteurs, l’âge moyen d’un demandeur de crédit est de 33,72 ans.

Pour les bons emprunteurs, il est de 40,3 ans. L’âge moyen des deux groupes est de 38 ans.

Les mauvais emprunteurs ont en moyenne 4,8 ans d’expérience dans leurs professions, les bons

emprunteurs ont en moyenne 8 ans d’expérience. L’ancienneté dans le métier exercé est en

moyenne de 8 ans.

Les bons et les mauvais emprunteurs sont entrés en contact avec la banque en 2008.

Quant au montant du crédit demandé, il est en moyenne de 1180$ pour les mauvais emprunteurs,

de 1578 $ pour les bons emprunteurs. Pour les deux groupes, il est de 1472$.

Le montant du crédit reçu est en moyenne de 1123$ pour les mauvais emprunteurs et de 1337$

pour les bons emprunteurs. Il est en moyenne de 1240$ pour les deux groupes.

Page 20 of 34

Le degré de rationnement les mauvais et les bons emprunteurs s’élève respectivement à 0,32 et à

0,202. En moyenne, il est de 0,234 pour les deux groupes.

Le nombre de jours séparant la date de demande de prêt et la date de réception du prêt est en

moyenne de 12,64 pour les mauvais emprunteurs et de 18,37 pour les bons

emprunteurs, et de 16,8 jours en moyenne pour les deux groupes. Le taux d’intérêt est presque le

même pour les bons et mauvais emprunteurs. Il est moyenne de 2,87% pour les deux groupes.

Les conditions financières s’élèvent en moyenne pour les mauvais emprunteurs à 32,48$ , pour

les bons emprunteurs à 37,36$. Le nombre de prêt déjà reçu est de 1,68 pour les mauvais

emprunteurs et de 2 pour les bons emprunteurs. La moyenne intra groupe est de 1,9. Enfin, la

valeur du bien donné en garantie est respectivement de 4 444 $ et de 7765$ pour les mauvais et

les bons emprunteurs. Remarquons en grosso modo que pour toutes les variables les moyennes

de bons emprunteurs sont supérieures à celles de mauvais emprunteurs

Tableau 4.2. Tests d'égalité des moyennes des groupes

Lambda de Wilks F ddl1 ddl2 Signification

Age du demandeur de crédit 0,904 9,734 1 92 0,002

Années d'expérience dans sa profession 0,907 9,383 1 92 0,003

Année de contact avec MECRE UVIRA 0,941 5,783 1 92 0,018

Montant du crédit demandé 0,968 3,022 1 92 0,085

Montant du crédit reçu 0,988 1,127 1 92 0,291

Degré de rationnement 0,998 ,230 1 92 0,633

Nombre de jour entre les dates de demande

et de reception crédit 0,979 2,016 1 92 0,159

Taux d'intérêt pratiqué sur le prêt 0,997 0,314 1 92 0,577

Conditions financières 0,986 1,280 1 92 0,261

Nombre de prêts déjà reçu 0,943 5,533 1 92 0,021

Valeur du bien donné en garantie 0,968 3,052 1 92 0,084

Source : Nos analyses avec SPSS

Au vu des résultats, nous allons rejeter H0 pour les variables dont les probabilités

critiques sont supérieures à 0,05(au seuil de 5%) ou à 0,1(au seuil de 10%) comme c’est

le cas pour l’ Age du demandeur de crédit, année d’expérience dans la profession, année

Page 21 of 34

de contact avec la banque, montant du crédit demandé(seulement au seuil de 10%), le

nombre de prêt déjà reçu et la valeur du bien donné en garantie(seulement au seuil de

10%). Pour ces variables, il y a une différence significative entre les moyennes de deux

groupes.

En outre, nous n’allons pas rejeter H0 si la probabilité critique est supérieure à

0,05. Cela est le cas pour les variables Montant du crédit reçu, degré de rationnement,

nombre de jours entre la date de demande et celle d’obtention du crédit, le taux d’intérêt

et les conditions financières. La différence n’est pas significative entre les moyennes de

ces eux groupes.

B. Les determinants du risqué de credit

B.1. Test d’indépendance entre le défaut de remboursement et ses déterminants

Les résultats de ce tableau permettent de présenter une analyse de dépendance entre

la variable défaut de remboursement et les variables présumées déterminants de ce défaut par

la littérature.

Tableau 4.3.: Analyse de la contingence entre le défaut de remboursement et ses

déterminants

Variable 1 Variable 2 Statistique calculée ( p-value)

Défaut rembour Milieu de provenance 3,43 (0,3304)

Défaut rembour Sexe 0,77 (0,3796)

Défaut rembours Activité 19,92 (0,0106)**4

Défaut rembours Type de prêt 2,74 (0,0977) ***5

Défaut rembours Objet du prêt 11,00 (0,2017)

Défaut de remboursement Type de garantie 7,23 (0,1244)

Source : nos analyses avec Tanagra

Ces résultats nous indiquent une dépendance entre la défaut de remboursement et le

milieu de provenance (p-value inférieure à 0,05).

4 Significatif au seuil de 5%

5Significatif au seuil de 10%

Page 22 of 34

La probabilité critique (ici 0,3796) supérieure à 0,05 n’indique pas de liaison significative

entre le défaut de remboursement et le sexe à la MECRE UVIRA. Le sexe n’influence donc pas

le défaut de remboursement. Ce résultat est différent de celui de certaines recherches précédentes

qui ont montré que les femmes représentent un meilleur risque de crédit que les hommes

notamment dans le contexte africain (Viganò, 1993).

Il y a une liaison significative entre le défaut de remboursement et la profession du

demandeur de crédit (p-value inférieure à 0,01).

La liaison entre le risque défaut de crédit et le type de prêt accordé (prêt à la production

ou à la consommation) n’est pas significative. Cette variable influence donc faiblement le

risque de défaut.

Par objet du prêt, on entend ici l’activité dans laquelle le demandeur du crédit a investi le

montant demandé. Ces résultats ne nous montrent pas une dépendance significative entre

l’activité exercée par le demandeur de crédit et le défaut de crédit.

Le type de garantie n’influence pas significativement le défaut de remboursement.

B.2. Estimation de la probabilité de défaut par la régression logistique

Tableau 4.4.1 Résultats de la régression logistique

B E.S. Wald ddl Signif. Exp(B)

IC pour Exp(B) 95,0%

Variables Inférieur Supérieur

AGE 0,054 0,052 1,064 1 0,302 1,055 0,953 1,169

Ancien 0,095 0,094 1,028 1 0,311 1,100 0,915 1,322

Contbque -0,016 0,501 0,001 1 0,975 0,984 0,369 2,627

Demandé 0,001 0,001 1,948 1 0,163 1,001 1,000 1,002

Montrecu -0,003 0,007 0,154 1 0,695 0,997 0,984 1,011

Degrati -0,214 0,275 0,606 1 0,436 0,807 0,471 1,384

EcartJours 0,022 0,024 0,894 1 0,344 1,023 0,976 1,071

Taux -0,530 1,859 0,081 1 0,775 0,588 0,015 22,487

Page 23 of 34

Condfin 0,065 0,236 0,075 1 0,784 1,067 0,672 1,694

Nbpret 0,767 0,560 1,880 1 0,170 2,154 0,719 6,454

Valgarant 0,000 0,000 0,014 1 0,906 1,000 1,000 1,000

Constante 29,387 1006,073 0,001 1 0,977 5,787E12

Source : Nos analyses

Les coefficients des variables explicatives ne sont pas statistiquement différents de zéro vu

que les statistiques de Wald sont inférieur à = . Aussi les

probabilités critiques qui sont supérieures à 0,05 le témoignent-elles.

Au seuil de 5%, aucune variable n’influence significativement le défaut de crédit.

Il arrive parfois que tous les coefficients pris individuellement soient non significatifs(R.

RAKOTOMALALA, 2009). En revanche, lorsque l'on teste leur nullité simultanée, on est amené

à rejeter l'hypothèse nulle. Ainsi la statistique khi-deux lu dans la table est inférieure au ratio

de vraisemblance (LR Stat=87,2). Cela veut dire que les coefficients estimés sont

homoscédastiques et que l’hypothèse de nullité des coefficients pris globalement est rejetée.

Si p est la probabilité de défaut, l’équation estimative du modèle est la suivante :

La probabilité de défaut est :

073,100600,0767,0065,0053,0022,0

214,0003,0001,0016,0095,0054,01

VGaNpCfTxEc

DeraMrMdContExpAgp

pogL

)073,100600,0767,0065,0053,0022,0214,0003,0001,0016,0095,0054,0(1

1

VGaNpCfTxEcDeraMrMdContExpAg

ep

)1(2

1 81,3)1(2

95,0

Page 24 of 34

Tableau 4.4.2. Table de prediction

Point de

coupure 4%

Point de

coupure 5%

Pourcentage de bonnes prédictions 78,7% 79,8 %

Pourcentage de mauvaises prédictions 21,3% 20,2 %

Pourcentage de bonnes prédiction pour

les bons emprunteurs

79, 5% 79, 5%

Pourcentage de bonnes prédiction pour

les mauvais emprunteurs

43,5%

43,5%

Au point de coupure de 0,5 ; Le modèle prédit correctement à 79,8% des cas correctement. Une fixation

plus conservatrice du point de coupure de 0.5 à 0.4 n’améliore pas le pouvoir de prédiction sur les

mauvais prêts. Elle affecte toutefois la performance globale de prédiction du modèle (79,8% à 78,7%).

Tableau 4.5.Tests de spécification du modèle

Khi-deux Ddl Signif.

Etape 1 Etape 21,273 11 0,031

Bloc 21,273 11 0,031

Modèle 21,273 11 0,031

Extrait de SPSS 16.0

Tableau 4.6. Récapitulatif du modèle

Etape

-2log-

vraisemblance R-deux de Cox &Snell R-deux de Nagelkerke

1 87,616a 0,203 0,295

Les pseudo-R2(de Cox et Snell) indiquent que le défaut de crédit est expliqué à 20, 3% et à

29,5% par les variables du modèle.

Tableau 4.7. Testde Hosmer-Lemeshow

Etape Khi-deux Ddl Signif.

Page 25 of 34

Tableau 4.7. Testde Hosmer-Lemeshow

Etape Khi-deux Ddl Signif.

1 10,109 8 0,257

Extrait de SPSS 16.0

Le p-value est supérieur au risque usuel de 5%. Le modèle est validé, il est compatible avec les

données.

C. Résultats de l’analyse discriminante et l’approche du crédit scoring

L’utilisateur aura le choix entre la fonction discriminante (une seule fonction) et les

fonctions de classement (dans notre cas : deux fonctions). Le traitement de notre base des

données par le biais du logiciel SPSS16 nous a permis d’identifier la fonction score suivante

Tableau 4.8. Coefficients des fonctions discriminantes canoniques standardisés

Fonction standardisée

Fonction non

standardisé

1 1

Age du demandeur de crédit (Ag) 0,393 0,043

Années d'expérience dans sa profession (Exp) 0,236 0,037

Année de contact avec MECRE UVIRA (Cont) -0,148 -0,216

Montant du crédit demandé (Md) 0,547 0,001

Montant du crédit reçu (Mr) -1,784 -0,002

Degré de rationnement (Dera) -0,123 -0,118

Nombre de jour entre les dates de demande et de réception crédit (Ec) 0,433 0,025

Taux d'intérêt pratiqué sur le prêt (Tx) -0,125 -0,372

Conditions financières (Cf) 1,174 0,047

Nombre de prêts déjà reçu (Np) 0,408 0,616

Valeur du bien donné en garantie (VGa) 0,163 0,000

Contant 431,88

Source : Nos analyses avec SPSS 16.0

Notre fonction score peut ainsi s’écrire :

4310,0616,0047,0372,0025,0

118,0002,0001,0216,0037,0043,0

VGaNpCfTxEc

DeraMrMdContExpAg

Z

Page 26 of 34

L’affectation aux groupes se fera en fonction des centroides de ces derniers, c'est-à-dire

par comparaison avec un score discriminant « moyen » pour chaque groupe. Ce score moyen est

calculé à partir de la fonction discriminante, où l’on remplace les valeurs individuelles par les

moyens des variables indépendantes pour le groupe dont on s’occupe.

Tableau 4.9. Fonction aux barycentres des groupes)

Bon ou mauvais emprunteur

Fonction

Score moyens

Mauvais emprunteur -0,777

Bon emprunteur 0,282

Source : Nos analyses avec SPSS

Chaque score individuel discriminant individuel est ensuite comparé aux deux scores

moyens et affecté au groupe dont-il est le plus proche. Mais la question qui se pose est la

suivante : à partir de quel score peut-on affecter les individus au groupe 1 (bon emprunteur) et

non pas au groupe 0 (mauvais emprunteur) ? Pour ce faire, on doit déterminer un score qui joue

le rôle de frontière entre les groupes. Si les groupes sont de dimensions égales, le score critique

est égal à la moyenne des moyennes des scores des groupes. Dans notre cas, ce score est égal : (-

0,777+0,2822)= -0,2474

Le score frontière est de -0,2474.

La règle de classement de chaque individu dans l’un ou l’autre groupe est alors la

suivante :

Tableau 4.10. Affectation de la valeur du score selon le modele

Valeur du score Affectation selon notre modèle

Score inférieur à -0,2474

Score supérieur à -0,2474

Mauvais emprunteur

Bon emprunteur

Source : Nos analyses

Page 27 of 34

Mais, il convient de signaler qu’il y a une zone d’incertitude qui se situe entre les deux centres

de gravité des deux groupes (-0,777 et 0,2822). Cette zone ne permet pas de trancher

définitivement sur la défaillance ou non des emprunteurs.

Concernant les fonctions de classement, le tableau ci-après donne les coefficients de ces deux

fonctions fournis par le traitement statistique. Ces coefficients permettent de classer les

emprunteurs dans les classes.

Tableau 4.11. La matrice de confusion

Bon ou mauvais emprunteur

Classe(s) d'affectation prévue(s)

Total Mauvais emprunteur Bon emprunteur

Original Effectif Mauvais emprunteur 20 5 25

Bon emprunteur 24 45 69

% Mauvais emprunteur 80,0 20,0 100,0

Bon emprunteur 34,8 65,2 100,0

Source : Nos analyses

De cette matrice nous lisons que la fonction score extraite ci-dessus permet de

classer 69,1489% (20+45/94) des emprunteurs correctement. Ce taux peut être décomposé ainsi

: Le pourcentage des bien classés pour les bons emprunteurs est égal à

20/23=87% ; Le pourcentage des bien classées pour les mauvais emprunteurs est égal à 45/69=

65,2174%. Par contre, le taux d’erreurs (emprunteurs mal classés) est égal (24+5)/94= 0,308511

%.

- l’erreur du premier type (classer un mauvais emprunteur par l’utilisation de la fonction

score parmi les bons emprunteurs) : ce taux est égal à 5/25=20 % ;

- et l’erreur du second type (classer un bon emprunteur comme un mauvais emprunteur par

le modèle): ce taux est égal à 24/69=34,7826%.

Cependant, le pourcentage d’individus correctement reclassées ne doit pas être

analysé dans l’absolu. Il doit être comparé au pourcentage que l’on obtiendrait si l’on reclassait

les individus au hasard. Pour ce faire, un test Q de Presses (Hair et al., 1992 ; cité par

Giannelloni et Vernette, cité par A. ELHAMMA, 2009, p.420) sera mené. Ce test vérifie que le

Page 28 of 34

pourcentage d’individus correctement classées est significativement plus important que celui

donné par un choix aléatoire. La statistique calculée suit une loi de Khi-deux (χ2) à 1 degré de

liberté.

L’hypothèse nulle est l’égalité des deux valeurs, c'est-à-dire le nombre d’individus bien classés

au hasard et le nombre d’individus classés par la fonction discriminante. L’expression de ce test

est la suivante :

𝑄𝑃𝑟𝑒𝑠𝑠𝑒 =[𝑛 − (𝑛𝑐 ∗ 𝑝)]

2

𝑛 ∗ (𝑝 − 1)=[94 − (65 ∗ 2)]2

9465 ∗ 2))=(9465 ∗ 2)2

94=1296

94= 13,76

Avec

- n: le nombre des emprunteurs de l’échantillon;

- nc : le nombre des emprunteurs correctement classés ;

- p : le nombre de groupes.

La valeur critique du χ2 à 1 degré de liberté est égale à 3,84, l’hypothèse nulle est rejetée. La

fonction discriminante est donc significativement plus performante que le hasard pour reclasser

correctement les emprunteurs.

Tableau 4.12. Corrélation canonique

Fonction Valeur propre

% de la

variance % cumulé Corrélation canonique

1 0,224a 100,0 100,0 0,428

Source : Extrait de SPSS

Plus la corrélation canonique est proche de 1, meilleur est le modèle. Dans

notre cas, la corrélation canonique est égale à 0,428. Le pouvoir discriminant de la

fonction discriminante extraite est de 42,8%.

Tableau 4.13. Lambda de Wilks

Test de la ou des

fonctions

Lambda de

Wilks Khi-deux ddl Signification

1 0,817 17,465 11 0,095

Source : Extrait de SPSS

Page 29 of 34

Également, la valeur de Lambda de Wilks6 étant faible, et est égale à 0, 817 et donc plus

proche de 1 que de 0, avec un khi-deux ayant un degré de signification moins élevé au seuil de

5% (supérieur à 0,05). Cela veut dire qu’au niveau global, la différence des moyennes des

groupes est significative (cf. réponses trouvées à travers le test de Student).

Pour s’assurer que la fonction discriminante classifie bien les entreprises en sous-groupes,

on analyse la matrice de confusion qui regroupe les entreprises bien classées et les mal classées.

C’est le moyen le plus utilisé est aussi le plus « parlant ». La matrice de confusion de notre

fonction score se présente comme suit :

D. Interprétation et discussions des résultats

Au vu des résultats présentés dans les tableaux ci-haut, certaines variables influences

positivement et d’autres négativement le risque de défaut de crédit.

Les variables qui influencent positivement le défaut sont l’âge du demandeur de crédit,

le nombre d’années d’expérience dans l’activité exercée, le montant demandé du crédit, l’écart

entre la date de demande et de réception du crédit, les conditions financières, le nombre de

prêts.

Celles qui influencent négativement le défaut de paiement sont sont l’année de contact

avec la banque, le montant demandé, le degré de rationnement etle taux d’intérêt.

Passons dans les lignes qui suivent à une discussion de certaines de ces variables.

a) Défaut de remboursement et écart entre le jour de demande et de réception du

crédit (temps d’attente)

Le signe positif du coefficient de cette variable (temps d’attente) nous indique qu’un

emprunteur qui observe une période d’attente plus longue est, toutes choses restantes égales par

ailleurs, plus susceptible d’être un mauvais emprunteur.

Ces résultats semblent s’écarter de ceux trouvés par A. DIALLO(2006), pourquoi le

temps d’attente influence négativement la probabilité de défaut.

66

Lambda de Wilks est le rapport de la variation intra-groupes à la variation totale. La variation intra-groupes est, pour chaque groupe, la somme des carrées des différences entre les scores discriminants individuels et le centroïde du groupe

Page 30 of 34

b) Défaut de remboursement et degré de rationnement

Les résultats issus du modèle indiquent que le fait d’être rationné est positivement lié à la

probabilité de défaut. Plusieurs facteurs sont pris en compte dans la décision de rationnement

mais les éléments les plus déterminants demeurent le plus souvent la nature de l’activité à

fiancer, le niveau de revenus et de richesse qui détermine sa capacité de remboursement. Zeller

(1994) cité par Diallo(2006) a obtenu des résultats similaires en analysant les déterminants du

rationnement de crédit parmi les prêteurs informels et les groupes de crédit formels au

Madagascar.

c) Défaut de remboursement et conditions financières

Comme le note BALEMBA (2010), nombreux auteurs s’accordent sur le fait que les

conditions financières augmentent la probabilité de défaut. Ainsi, plus les conditions financières

élevées, plus lourdes deviennent les charges chez l’emprunteur et le risque de non

remboursement augmente. Cette réalité n’est pas contredite par nos résultats. Plus les conditions

financières sont élevées, plus grande est la probabilité de défaut.

A en croire Diallo (2006), l’exigence de conditions financières vise au moins deux

objectifs. Premièrement, les conditions financières visent à tester la disposition de l’emprunteur à

contribuer financièrement au projet à financer et son engagement envers ce projet.

Deuxièmement elles visent à sécuriser l’institution contre le risque de crédit et le risque

d’illiquidité.

d) Défaut de remboursement et Taux d’intérêt

Théoriquement, plus le taux d’intérêt est élevé, plus la probabilité de défaut

augmente. Cette hypothèse n’est pas confirmée par nos résultats. Cela est aussi pour les autres

variables dont les signes ne sont pas conformes aux signes attendus. Cela serait dû soit à la

petitesse de la taille de l’échantillon, soit à aux réalités propres de la MECRE/UVIRA.

Page 31 of 34

5. CONCLUSION : IMPLICATION EN TERMES DE POLITIQUE

PUBLIQUE, ORIGINALITE ET PERSPECTIVES DE FUTURES

RECHERCHE

Cet article s`est engagé dans une problématique cherchant à savoir les principaux

déterminants du défaut de remboursement à la MECRE/UVIRA, les variables qui permettent de

différencier les bons de mauvais emprunteurs, la prédiction du risque de non remboursement du

crédit octroyé.

En guise d’hypothèses nous avons présumé que les principaux déterminants de défaut

de crédit à la MECRE/UVIRA seraient le montant du crédit octroyé, l’ancienneté dans l’activité

exercé, le niveau d’étude du demandeur de crédit, le taux d’intérêt pratiqué, le degré de

rationnement ; le montant du crédit demandé seraient les principales variables pouvant

discriminer les bons de mauvais emprunteurs et par conséquent les déterminants de l’octroi de

crédit.

Sur le plan délimitation, ce papier a donné comme champ d`application la MECRE

UVIRA, au courant de l`année 2011 avec un échantillon de 100 emprunteurs individuels dont 94

demande ont été acceptées et 6 ont été refusées.

Afin de bien vérifier les différentes hypothèses émises, nous avons fait recours aux

différentes méthodes dont les principales sont le test de student pour la comparaison des

moyennes des variables pour les bons et les mauvais emprunteurs, le test de Khi-deux qui nous

aidé à rechercher la dépendance entre le défaut de remboursement et certaines variables

qualitatives; enfin et surtout l’analyse discriminante de Fisher et la régression logistiques qui

nous respectivement servi à trouver les fonctions qui nous permettent de séparer, différencier

les bons de mauvais emprunteur et à rechercher le probabilité de défaut associée à chaque

emprunteur.

Les résultats du test de Student nous ont montré une l’égalité des moyennes entre bons et

mauvais emprunteurs pour les variables suivantes : Montant du crédit reçu, degré de

rationnement, temps d’attente, taux d’intérêt, conditions financières, nombre de prêt déjà reçu,

valeur de la garantie. Ainsi, ces variables ne permettent pas de discriminer les bons de mauvais

emprunteur, car chaque variable est en moyenne égale pour les deux catégories.

Page 32 of 34

Par contre, une différence significative des moyennes pour les deux groupes a été

constatée pour les variables Age du demandeur de crédit, années d’expérience, année de contact

avec la banque et le montant du crédit demandé. Ces variables permettent de différencier les

bons de mauvais emprunteurs.

Le test de Khi-deux, se construisant à l’aide des variables discrètes, nous a aidé à

déterminer les variables dont dépend le défaut de remboursement. Il a été trouvé que les

variables qui influencent significativement le défaut de remboursement sont l’activité exercé et

le type de prêt. Cette première analyse, complétée avec celle de la régression logistique, nous a

permis de répondre à notre première question de départ qui cherchait à connaître les principaux

déterminants du défaut de remboursement du crédit.

La régression logistique qui nous a servi à déterminer les déterminants de la probabilité

de défaut et par le même fait la probabilité de défaut associée à chaque demandeur de crédit.

Par le même outil, nous avons identifié les variables qui influencent positivement et

négativement la probabilité de défaut, mais aussi déterminer cette probabilité pour chaque

emprunteur.

L’analyse discriminante extraite de SPSS 16.0 nous a permis de mettre sur place un

premier modèle de distinction entre les bons et les mauvais emprunteurs. Dans ce modèle,

chaque emprunteur est classé bon ou mauvais selon que le score obtenu sur base de ses

caractéristiques est supérieur ou inférieur au score frontière. Une deuxième catégorie de modèles

a mis à notre dispositions une fonction score pour les bons et une autre pour les mauvais

emprunteurs. Dès lors, chaque emprunteur est classé dans la fonction où il a un score plus élevé.

Implications en termes de politique publique

Le présent travail n’est pas un simple exercice intellectuel. Ces résultats présentent une

importance dès lors qu’ils sont appliqués par la MECRE/UVIRA. En effet, les résultats de cette

recherche à la MECRE/UVIRA de prédire la probabilité de défaut de remboursement pour

tout demandeur de crédit ainsi sur base de la fonction score établie au moyen de la méthode

discriminante. Ainsi, il est possible pour cette institution de microfinance, toutes choses égales

par ailleurs de distinguer avec un faible risquer de se tromper les bons des mauvais

Page 33 of 34

emprunteurs et par conséquent minimiser le taux du portefeuille à risque et donc maximiser la

valeur de l’institution en termes financiers.

Originalité

Le présent papier bien que ne soit le premier à appliquer la fonction discriminante et la

régression logistique pour l’analyse du risque de crédit présente certains points qui impliquent

son originalité. En effet, la détermination de la probabilité de défaut de remboursement et ses

déterminants en présente une originalité d’une part et le contexte dans lequel il est appliqué

en présente une autre dans la mesure où il n’existe presque pas des travaux ayant jeté les

jalons sur cette thématique au sein de notre milieu d’étude.

Perspectives de recherche

Enfin, nous pouvons clore notre travail en nous épargnant de toute affirmation selon

laquelle toute la matière en rapport avec notre thématique de recherche a été abordée dans la

globalité des aspects. C`est pourquoi, nous lançons un appel à tous les esprits scientifiques

désireux de travailler dans le même domaine de recherche de bien vouloir nous approfondir

cette étude en élargissant la taille de l’échantillon et en utilisant les données sur les

entreprises(les ratios) et non sur les personnes physiques scientifiques désireux de travailler dans

le même domaine de recherche de bien vouloir nous approfondir et nous corriger dans le but de

pouvoir perfectionner notre travail.

BIBLIOGRAPHIE

ARTICLES ET OUVRAGES 1. BARDOS M. (2001), Analyse discriminante, application au risque et scoring financier, Dunod

2. BOUBACAR DIALLO (2006), Un modèle de Credit Scoring pour une institution de micro-finance

africaine : le cas de nyesigiso au mali, Laboratoire d`Économie d`Orléans,.

Page 34 of 34

3. BRAILOVSKYJ. (2008), Modèles de risque de crédit à la consommation: étude du rôle de

l'économie dans la probabilité de défaut, université de Québec à Montréal, Québec

4. CHURCHILL C. et COSTER D (2001), Manuel de gestion des risques en micro finance. CARE.

5. CORNEE S. (2006), Analyse de la convergence entre performances financières et performances

sociales : application de la méthode Data EnvolpmentAnalysis sur 18 : Institutions de micro-finances

péruviennes, maitrise en science de gestion

6. FISCHER k. P. (2000), Régie, réglementation et performance des coopératives financiers, Annales

de l’économie publique sociale et coopérative, 2000, Vol. 71.

7. MISHKIN F. (2007), Monnaie, banque et marchés financiers, Nouveaux Horizons, 8e édition, Paris

8. PLATTEAU J.-P. (1987), La Nouvelle Économie Institutionnelle et la problématique

coopérative,Cahiers de la Faculté des Sciences Économiques et Sociales de Namur.

9. SARPOTA G. (S.D), La notation statistique des emprunteurs ou « scoring », Conservatoire des arts

et métiers, Paris

10. TCHAKOUTE HUBERT et LAMARQUEERIC (2008), La gestion des risques opérationnels

dans les institutions de micro finance; une approche exploratoire, université de Montesquieu,

bordereaux IV.

11. TCHUMKAM C. (2008), Analyse des déterminants de l`octroi du crédit bancaire aux entreprises :

le cas de Afriland First Bank de Yaoundé, maitrise en sciences de gestion.

SITES CONSULTÉS

1. http:// www.lamicrofinance.org

2. http:// www.labanque.org