André Socard Conseil

 

Notes et Documents :

Fiabilité - Disponibilité

Dans ce papier, nous présentons quelques données élémentaires sur la fiabilité et la disponibilité. En effet, lorsque pour un composant élémentaire d'un équipement ou d'un système, on affiche un MTTF (Mean Time To Failure) de 100 ans par exemple, bien souvent la remarque est faite : "pensez-vous que ce composant a quelque chance de remplir sa fonction dans 100 ans.
Ce papier se propose de répondre à cette question, et de donner quelques éléments sur le calcul de la disponibilité. Il explique pourquoi la probabilité de défaillance de l'élément au temps t est une loi exponentielle. Souvent ceci est affirmé sans commentaire, ou bien des lois plus compliquées 'Weibull par exemple sont adoptées, sans justification ou définition du domaine physique d'application.

1. Rappel sur la courbe en "baignoire". 

Lorsque l'on dispose d'un nombre important de composants ou d'équipements identiques, on peut faire des relevés de la durée de vie moyenne de ces composants. 

  • Au début de la vie du composant, on constate une mortalité assez élevée, le taux de mortalité décroissant assez rapidement lorsque le composant a franchi avec succès les dangers de sa jeune vie.

  • Le taux de mortalité se stabilise ensuite

  • Pour ensuite s'accroître lorsque le vieillissement du composant apparaît.

  • Dans différents domaines, cette "loi" est assez générale. Si on reporte le taux de mortalité en fonction de l'âge du composant, on obtient une courbe en baignoire. En fait, on la rencontre le plus souvent dans le domaine mécanique, dans lequel apparaît la phase d'usure. En électronique, cette phase d'accroissement du taux de mortalité avec l'âge est rarement atteinte, l'obsolescence intervient plus tôt que le vieillissement des composants.

    La mortalité infantile sera éliminée en grande partie par une mise sous tension des équipements, en usine, avant de les livrer. C'est le déverminage.

    Pendant une durée assez longue de la vie du composant, la probabilité que le composant meure pendant une période donnée est quasiment indépendante de l'âge du composant. Sur ce schéma, le fond de la baignoire a été tracé parfaitement plat, cette probabilité est dans cette zone parfaitement indépendante de cet âge.

    Nous parlons ici de mortalité d'un composant, en fiabilité, on parle plus généralement de défaillance (ou failure), cessation de l'aptitude d'une entité à remplir une fonction requise. L'entité passe alors à l'état de panne.

    En électronique, on peut distinguer les défaillances dites catalectiques, c'est à dire soudaines et totales, des défaillances par dérive, défaillance partielle mais qui nécessitera une intervention de maintenance.

    2. La fiabilité, le taux de défaillance  l et le MTTF

    Pour simplifier, restons dans le cas de la défaillance catalectique et où le taux de défaillance est constant.

    La probabilité que l'entité tombe en panne en un temps donné infiniment court, dt, entre t et t+dt, si cette entité est en bon état de fonctionnement à l'instant t sera :

      l . dt

    Appelons P(t) la probabilité que l'entité soit en bon fonctionnement au temps t.

    La probabilité qu'elle soit en fonctionnement à t + dt sera

    P(t+dt) = (1-l.dt).P(t)

    On en déduit directement : 

       

     et :

             

    En prenant comme origine des temps un moment où l'entité est en fonctionnement,

    P = e -lt

    La probabilité de vie à l'instant t répond à une loi de probabilité exponentielle. On voit que la seule hypothèse prise est que la probabilité de mort dans un temps dt est proportionnelle à ce temps dt. Souvent, cette loi exponentielle est étudiée dans tout traité de probabilité sans que l'on voit le lien avec les faits physiques. Elle intervient donc dans les travaux sur la fiabilité, on la retrouve pour des raisons analogues dans les études de trafic, téléphonique notamment, et les études de files d'attente...

    La durée moyenne de vie (espérance de vie) sera :

      

    La durée moyenne de vie sera donc 1/l.  Le temps moyen de fonctionnement MTTF sera donc égal à 1/l.

    Ce paramètre l caractérise la fiabilité de l'entité. Il s'exprime en FIT Failure In Time, la durée fixée étant 109 heures.
    Cette unité est très petite et adaptée aux composants élémentaires, elle correspond à un MTTF de 105 ans environ (une année représente en gros 10 000 heures). Une carte électronique de qualité a un MTTF de 100 ans environ, donc un FIT de 1 000. Cette unité est surtout utilisée pour les calculs de fiabilité prévisionnelle des cartes électroniques et équipements. En exploitation, on préfère parler de MTTF, mais en se rappelant que c'est l'inverse d'un taux de défaillance.

    Note : Souvent on parle improprement de MTBF, au lieu de MTTF. Le terme MTBF (Mean Time Between Failure), d'après la norme NF X 60-500 s'applique aux systèmes réparables, il désigne le temps entre deux défaillances, et inclut donc le MTTF et le temps moyen de réparation MTTR (Mean Time To Repair). Le MTBF est la somme du MTTF et du MTTR.

    3. La disponibilité d'un équipement.

    La disponibilité sera la proportion du temps où l'équipement sera opérationnel, l'indisponibilité la proportion où il sera défaillant, ou en étant plus rigoureux, la disponibilité sera la probabilité qu'à un instant le système soit disponible. traçons un diagramme où l'état 0 est celui où le système est disponible, et l'état 1 où le système est défaillant.

    Le passage de l'état 0 à t à l'état 1à t+dt a une probabilité égale à l.dt. Le passage de l'état 1 défaillant à t, à l'état 0, réparé à t+dt, a une probabilité µ(t).dt.

    Complétons ce schéma par toutes les transitions possibles, c'est à dire où entre t et t+dt, les états sont maintenus (cette représentation est pratiquement celle d'une chaîne de Markov :

    Appelons les probabilités d'être en 0 et 1, P0(t) et P1(t), et remarquons que le système étant à tout instant à l'état 0 ou 1 :
                                                                                 P0(t) + P1(t) = 1.
    On peut écrire les équations suivantes :
                                                                                 P0(t+dt)=(1-
    l.dt).P0(t) + µ.P1(t).dt
                                                                                 P1(t+dt)=
    l.P0(t).dt + (1-µ.dt).P1(t)
    ce qui peut s'écrire :
                                                                                
    P'1(t) = - P'0(t) = l.P0(t) - µ.P1(t)
    Lorsque le régime est stationnaire,
    P'0(t) = P'1(t) = 0 et
                                                                                
    l.P0(t) = µ.P1(t)
                                                                           
    .       P0 = µ / (l + µ)   et   P1 = l   / (l + µ.)

       
    Disponibilité : MTTF / (MTTR+MTTF) = MTTF / MTBF
    Indisponibilité : MTTR / MTBF
       

    4. La disponibilité d'un équipement secouru.

    Dans la mesure où les équipes de maintenance sont disponibles (deux réparateurs indépendants) pour réparer simultanément l'équipement normal et le secours, le diagramme des états et les transitions peut se schématiser ainsi :

    L'état 0 correspond à 0 équipement défaillant, l'état 1 le système fonctionne sur le secours, et l'état 2 le système est défaillant, l'équipement normal est défaillant, ainsi que le secours.
    En écrivant que les probabilités 
    P0, P1 et  P2 sont indépendantes du temps, nous obtenons les équations :
                                                                                 - 2
    l P0 + µ P1 = 0
                                                                                 
      2l P0 + ( l+µ) P1 + 2µ P2 = 0
                                                                                                      
    l P1 - 2µ P2 = 0

    et en se rappelant que P
    0+ P1+ P2 = 1
    on obtient :  
    P0 = µ²/(l+µ)²
                              P1 = 2lµ/(l+µ)²
                       P2 = l²/(l+µ)²
    ou bien :                                             Indisponibilité = P2 = (MTTR / MTBF)²

    On voit le gain très important en disponibilité. Ceci suppose :

    Dans la pratique, on devra tenir compte de la fiabilité du système de surveillance et du dispositif de commutation. Le schéma se compliquera un peu, mais le principe reste. De plus, lorsque l'équipement fonctionne sur secours, on émettra une alarme mineure et le MTTR sera augmenté. L'investissement d'un équipement de secours permet de réduire les frais de maintenance (par exemple, réduction des équipes le week-end).

    5. Conclusion.

    Nous avons esquissé le principe des méthodes simples qu'il est possible d'utiliser pour estimer la disponibilité d'un système, après avoir rappelé des éléments de fiabilité.

    Nous sommes restés très simples, des livres peuvent être consultés pour aller plus loin :

    Pour les données de fiabilité des composants, la MIL Handbook 217 qui doit en être à la version E.
    Des livres où les aspects théoriques sont assez développés comme "Processus stochastiques et fiabilité des systèmes"  de Christine COCOZZA-THIVENT aux éditions Springer ou bien en restant aux livres en français, Fiabilité des systèmes de Jean-Louis BON aux éditions Masson. Les normes NF X 60 500, 60-520 et 60-510 peuvent être consultées avec intérêt, et pour analyser les défauts, la méthode AMDEC sera utilisée...tout un monde s'ouvre, que je n'ai fait qu'effleurer dans cette page.

    Nota : Cette page est certainement encore imparfaite, malgré des premières corrections qu'a bien voulu me proposer Monsieur Lambert PIERRAT, consultant.

    Page revue le 7 février 2005.

    Accueil - L'entreprise - Secteurs techniques - Types d'intervention - Références - Notes et documents

    retour haut de page


    Contactez-nous
    vos commentaires seront appréciés

     

    Socard Consultants

    4 allée Pernette du Guillet

    75019 Paris

    France