%\input accents
%\input colordvi
\input srctex.sty

\magnification=1200
\pretolerance=500 \tolerance=1000 \brokenpenalty=5000
\vsize=20cm\hsize=13.2cm
\parindent=0mm
\parskip=5pt plus 1pt minus 1pt

% new fonts definitions

\font\seventeenbf=ecbx10 at 17.28pt
\font\fourteenbf=ecbx10 at 14.4pt
\font\twelvebf=ecbx10 at 12pt
\font\eightbf=ecbx8
\font\sixbf=ecbx6

\font\twelvei=cmmi10 at 12pt
\font\eighti=cmmi8
\font\sixi=cmmi6

\font\twelverm=ecrm10 at 12pt
\font\eightrm=ecrm8
\font\sixrm=ecrm6

\font\eightplrm=cmr8
\font\sixplrm=cmr6
\font\fiveplrm=cmr5

\font\eightsy=cmsy8
\font\sixsy=cmsy6

\font\eightit=ecti8
\font\eighttt=ectt8
\font\eightsl=ecsl8

\font\seventeenbsy=cmbsy10 at 17.28pt
\font\fourteenbsy=cmbsy10 at 14.4pt
\font\twelvebsy=cmbsy10 at 12pt
\font\tenbsy=cmbsy10
\font\eightbsy=cmbsy8
\font\sevenbsy=cmbsy7
\font\sixbsy=cmbsy6
\font\fivebsy=cmbsy5

\font\tenmsa=msam10
\font\eightmsa=msam8
\font\sevenmsa=msam7
\font\fivemsa=msam5
\newfam\msafam
  \textfont\msafam=\tenmsa
  \scriptfont\msafam=\sevenmsa
  \scriptscriptfont\msafam=\fivemsa
\def\msa{\fam\msafam\tenmsa}

\font\tenmsb=msbm10
\font\eightmsb=msbm8
\font\sevenmsb=msbm7
\font\fivemsb=msbm5
\newfam\msbfam
  \textfont\msbfam=\tenmsb
  \scriptfont\msbfam=\sevenmsb
  \scriptscriptfont\msbfam=\fivemsb
\def\Bbb{\fam\msbfam\tenmsb}

\font\tenCal=eusm10
\font\sevenCal=eusm7
\font\fiveCal=eusm5
\newfam\Calfam
  \textfont\Calfam=\tenCal
  \scriptfont\Calfam=\sevenCal
  \scriptscriptfont\Calfam=\fiveCal
\def\Cal{\fam\Calfam\tenCal}

\font\teneuf=eusm10
\font\teneuf=eufm10
\font\seveneuf=eufm7
\font\fiveeuf=eufm5
\newfam\euffam
  \textfont\euffam=\teneuf
  \scriptfont\euffam=\seveneuf
  \scriptscriptfont\euffam=\fiveeuf
\def\euf{\fam\euffam\teneuf}

\font\seventeenbfit=cmmib10 at 17.28pt
\font\fourteenbfit=cmmib10 at 14.4pt
\font\twelvebfit=cmmib10 at 12pt
\font\tenbfit=cmmib10
\font\eightbfit=cmmib8
\font\sevenbfit=cmmib7
\font\sixbfit=cmmib6
\font\fivebfit=cmmib5
\newfam\bfitfam
  \textfont\bfitfam=\tenbfit
  \scriptfont\bfitfam=\sevenbfit
  \scriptscriptfont\bfitfam=\fivebfit
\def\bfit{\fam\bfitfam\tenbfit}

\def\gS{\hbox{\teneuf S}}

% changing font sizes

\catcode`\@=11
\def\eightpoint{%
  \textfont0=\eightplrm \scriptfont0=\sixplrm \scriptscriptfont0=\fiveplrm
  \def\rm{\fam\z@\eightrm}%
  \textfont1=\eighti \scriptfont1=\sixi \scriptscriptfont1=\fivei
  \def\mit{\fam\@ne\eighti}%
  \def\oldstyle{\fam\@ne\eighti}%
  \textfont2=\eightsy \scriptfont2=\sixsy \scriptscriptfont2=\fivesy
  \textfont\itfam=\eightit
  \def\it{\fam\itfam\eightit}%
  \textfont\slfam=\eightsl
  \def\sl{\fam\slfam\eightsl}%
  \textfont\bffam=\eightbf \scriptfont\bffam=\sixbf
  \scriptscriptfont\bffam=\fivebf
  \def\bf{\fam\bffam\eightbf}%
  \textfont\ttfam=\eighttt
  \def\tt{\fam\ttfam\eighttt}%
  \textfont\msbfam=\eightmsb
  \def\Bbb{\fam\msbfam\eightmsb}%
  \abovedisplayskip=9pt plus 2pt minus 6pt
  \abovedisplayshortskip=0pt plus 2pt
  \belowdisplayskip=9pt plus 2pt minus 6pt
  \belowdisplayshortskip=5pt plus 2pt minus 3pt
  \smallskipamount=2pt plus 1pt minus 1pt
  \medskipamount=4pt plus 2pt minus 1pt
  \bigskipamount=9pt plus 3pt minus 3pt
  \normalbaselineskip=9pt
  \setbox\strutbox=\hbox{\vrule height7pt depth2pt width0pt}%
  \let\bigf@ntpc=\eightrm \let\smallf@ntpc=\sixrm
  \normalbaselines\rm}
\catcode`\@=12

\def\eightpointbf{%
 \textfont0=\eightbf   \scriptfont0=\sixbf   \scriptscriptfont0=\fivebf
 \textfont1=\eightbfit \scriptfont1=\sixbfit \scriptscriptfont1=\fivebfit
 \textfont2=\eightbsy  \scriptfont2=\sixbsy  \scriptscriptfont2=\fivebsy
 \eightbf
 \baselineskip=10pt}

\def\tenpointbf{%
 \textfont0=\tenbf   \scriptfont0=\sevenbf   \scriptscriptfont0=\fivebf
 \textfont1=\tenbfit \scriptfont1=\sevenbfit \scriptscriptfont1=\fivebfit
 \textfont2=\tenbsy  \scriptfont2=\sevenbsy  \scriptscriptfont2=\fivebsy
 \tenbf}
        
\def\twelvepointbf{%
 \textfont0=\twelvebf   \scriptfont0=\eightbf   \scriptscriptfont0=\sixbf
 \textfont1=\twelvebfit \scriptfont1=\eightbfit \scriptscriptfont1=\sixbfit
 \textfont2=\twelvebsy  \scriptfont2=\eightbsy  \scriptscriptfont2=\sixbsy
 \twelvebf
 \baselineskip=14.4pt}

\def\fourteenpointbf{%
 \textfont0=\fourteenbf   \scriptfont0=\tenbf   \scriptscriptfont0=\sevenbf
 \textfont1=\fourteenbfit \scriptfont1=\tenbfit \scriptscriptfont1=\sevenbfit
 \textfont2=\fourteenbsy  \scriptfont2=\tenbsy  \scriptscriptfont2=\sevenbsy
 \fourteenbf
 \baselineskip=17.28pt}

\def\seventeenpointbf{%
 \textfont0=\seventeenbf  \scriptfont0=\twelvebf  \scriptscriptfont0=\eightbf
 \textfont1=\seventeenbfit\scriptfont1=\twelvebfit\scriptscriptfont1=\eightbfit
 \textfont2=\seventeenbsy \scriptfont2=\twelvebsy \scriptscriptfont2=\eightbsy
 \seventeenbf
 \baselineskip=20.736pt}
 
% main item macros

\newdimen\srdim \srdim=\hsize
\newdimen\irdim \irdim=\hsize
\def\NOSECTREF#1{\noindent\hbox to \srdim{\null\dotfill ???(#1)}}
\def\SECTREF#1{\noindent\hbox to \srdim{\csname REF\romannumeral#1\endcsname}}
\def\INDREF#1{\noindent\hbox to \irdim{\csname IND\romannumeral#1\endcsname}}
\newlinechar=`\^^J
\def\openauxfile{
  \immediate\openin1\jobname.aux
  \ifeof1
  \message{^^JCAUTION\string: you MUST run TeX a second time^^J}
  \let\sectref=\NOSECTREF \let\indref=\NOSECTREF
  \else
  \input \jobname.aux
  \message{^^JCAUTION\string: if the file has just been modified you may 
    have to run TeX twice^^J}
  \let\sectref=\SECTREF \let\indref=\INDREF
  \fi
  \message{to get correct page numbers displayed in Contents or Index 
    Tables^^J}
  \immediate\openout1=\jobname.aux
  \let\END=\end \def\end{\immediate\closeout1\END}}
        
\newcount\notthispage \notthispage=1

\newbox\titlebox   \setbox\titlebox\hbox{\hfil}
\newbox\sectionbox \setbox\sectionbox\hbox{\hfil}
\newbox\chapterbox \setbox\chapterbox\hbox{\hfil}
\def\folio{\ifnum\pageno=\notthispage \hfil
           \else \ifodd\pageno
           \hfil {\eightpoint \copy\chapterbox\copy\sectionbox%
           \kern8mm\number\pageno}\else
           {\eightpoint\number\pageno\kern8mm\copy\titlebox}\hfil \fi\fi}
\footline={\hfil}
\headline={\folio}           

\def\blankline{\phantom{}\hfil\vskip0pt}
\def\titlerunning#1{\setbox\titlebox\hbox{\eightpoint #1}}
\def\chapterrunning#1{\notthispage=\pageno
    \setbox\chapterbox\hbox{\eightpoint #1}}
\def\title#1{\noindent\hfil$\smash{\hbox{\seventeenpointbf #1}}$\hfil
             \titlerunning{#1}\medskip}
\def\titleleft#1{\noindent$\smash{\hbox{\seventeenpointbf #1}}$\hfil
                 \titlerunning{#1}\medskip}

\def\supersection#1{%
  \par\vskip0.5cm\penalty -100 
  \vbox{\baselineskip=17.28pt\noindent{{\fourteenpointbf #1}}}
  \vskip3pt
  \penalty 500
  \titlerunning{#1}}

\newcount\numbersection \numbersection=-1
\def\sectionrunning#1{\setbox\sectionbox\hbox{\eightpoint #1}
  \immediate\write1{\string\def \string\REF 
      \romannumeral\numbersection \string{%
      \noexpand#1 \string\dotfill \space \number\pageno \string}}}
\def\section#1{%
  \par\vskip0.5cm\penalty -100
  \vbox{\baselineskip=14.4pt\noindent{{\twelvepointbf #1}}}
  \vskip2pt
  \penalty 500
  \advance\numbersection by 1
  \sectionrunning{#1}}

\def\subsection#1{%
  \par\vskip0.5cm\penalty -100
  \vbox{\noindent{{\tenpointbf #1}}}
  \vskip1pt
  \penalty 500}

\newcount\numberindex \numberindex=0  
\def\index#1#2{%
  \advance\numberindex by 1
  \immediate\write1{\string\def \string\IND #1%
     \romannumeral\numberindex \string{%
     \noexpand#2 \string\dotfill \space \string\S \number\numbersection, 
     p.\string\ \space\number\pageno \string}}}

\def\chapterjump{
  \vfill\eject
  \ifodd\pageno \else {\headline={\hfil}\null\vskip0pt\vfill\eject} \fi
}

% Usual sets of numbers  
\def\bC{{\Bbb C}}
\def\bN{{\Bbb N}}
\def\bP{{\Bbb P}}
\def\bQ{{\Bbb Q}}
\def\bR{{\Bbb R}}
\def\bZ{{\Bbb Z}}

% Calligraphic capital letters
\def\cA{{\Cal A}}
\def\cC{{\Cal C}}
\def\cF{{\Cal F}}
\def\cL{{\Cal L}}
\def\cP{{\Cal P}}
\def\cR{{\Cal R}}
\def\cV{{\Cal V}}

\def\tC{\smash{\tilde C}}

\def\hexnbr#1{\ifnum#1<10 \number#1\else
 \ifnum#1=10 A\else\ifnum#1=11 B\else\ifnum#1=12 C\else
 \ifnum#1=13 D\else\ifnum#1=14 E\else\ifnum#1=15 F\fi\fi\fi\fi\fi\fi\fi}
\def\msatype{\hexnbr\msafam}
\def\msbtype{\hexnbr\msbfam}

\mathchardef\smallsetminus="2\msbtype72   \let\ssm\smallsetminus
\mathchardef\leqslant="3\msatype36
\mathchardef\geqslant="3\msatype3E
\mathchardef\complement="0\msatype7B
\let\ge=\geqslant
\let\le=\leqslant
\let\dsp=\displaystyle

\def\square{{\hfill \hbox{
\vrule height 1.453ex  width 0.093ex  depth 0ex
\vrule height 1.5ex  width 1.3ex  depth -1.407ex\kern-0.1ex
\vrule height 1.453ex  width 0.093ex  depth 0ex\kern-1.35ex
\vrule height 0.093ex  width 1.3ex  depth 0ex}}}
\def\qed{\phantom{$\quad$}\hfill$\square$}
\def\?{\hbox{$\,$}}

\catcode`@=11
\def\cmalign#1#2{\null\,\vcenter{\normalbaselines\m@th
    \ialign{$\displaystyle ##$\hfil&&\kern#1$\displaystyle ##$\hfil\crcr
      \mathstrut\crcr\noalign{\kern-\baselineskip}
      #2\crcr\mathstrut\crcr\noalign{\kern-\baselineskip}}}\,}
\catcode`@=12

\def\itemv{%
\item{\llap{$\square\kern7pt$}\llap{$\raise0.6pt\hbox{$\times$}\kern6pt$}}}
\def\itemf{%
\item{\llap{$\square\kern7pt$}}}

\def\lguil{\hbox{%
\raise1pt\hbox{$\scriptscriptstyle\langle\!\langle\kern1pt$}}}
\def\rguil{\hbox{%
\raise1pt\hbox{$\kern1pt\scriptscriptstyle\rangle\!\rangle$}}}

\def\sqind#1{\kern1.5pt\rlap{\raise5pt\hbox{$\scriptstyle#1$}}\kern-1.5pt}

\font\twelvebf=ecbx10 at 12pt
\def\HK{{\rm HK}}
\def\cotan{\mathop{\rm cotan}}
\def\cotanh{\mathop{\rm cotanh}}
\def\supess{\mathop{\rm sup\,ess}}
\def\infess{\mathop{\rm inf\,ess}}
\def\Id{\mathop{\rm Id}}
\def\Re{\mathop{\rm Re}}
\def\Im{\mathop{\rm Im}}
\def\Jac{\mathop{\rm Jac}}
\def\Supp{\mathop{\rm Supp}}
\def\oscil{\mathop{\rm oscil}}
\def\vol{\mathop{\rm vol}}
\def\aspect{\mathop{\rm aspect}}
\def\aire{\mathop{\rm aire}}
\def\longueur{\mathop{\rm longueur}}
\def\diam{\mathop{\rm diam}}
\def\sign{\mathop{\rm sign}}
\def\grad{\mathop{\rm grad}}
\def\rot{\mathop{\rm rot}}
\def\div{\mathop{\rm div}}
\def\note#1#2{\footnote{${}^{\hbox{\sevenrm(#1)}}$}
{\baselineskip=8pt
{\eightpoint #2}\vskip-15pt}}
\def\\{\hfil\break}
\def\demi{\textstyle{1\over 2}}
\def\ovl{\overline}
\def\ovr{\overrightarrow}
\def\ul#1{$\underline{\smash{\hbox{#1}}}$}

\def\build#1^#2_#3{\mathop{#1}\limits^{#2}_{#3}}

\def\boxed#1#2{\hbox{%
        \leavevmode\thinspace\hbox{\vrule\vtop{\vbox{\hrule\kern1pt
        \hbox{\thinspace{$\displaystyle
        \raise2.5pt\hbox{\phantom{\vrule width 0.1pt height #1pt depth #1pt}}
        #2$}\thinspace}}
      \kern1pt\hrule}\vrule}\thinspace}}

% inclusion of PostScript files
\special{header=/home/demailly/psinputs/mathdraw/mdrlib.ps}

\def\RGBColor#1#2{\special{color push rgb #1}#2\special{color pop}}

\long\def\InsertFig#1 #2 #3 #4\EndFig{\par
\hbox{\hskip #1mm$\vbox to#2mm{\vfil\special{" 
#3}}#4$}}

\long\def\InsertPSFile#1 #2 #3 #4 #5 #6\EndFig{\par
\hbox{\hskip #1mm$\vbox to#2mm{%
\vfil\special{psfile=#5 hscale=#3 vscale=#4}}#6$}}

\long\def\InsertImage#1 #2 #3 #4 #5 #6 #7 #8\EndFig{\par
\hbox{\hskip #1mm$\vbox to#2mm{%
\vfil\special{psfile="`img2eps file #7 height #4 mm width #3 mm gamma #5
angle #6}}#8$}}

\long\def\LabelTeX#1 #2 #3\ELTX{\rlap{\kern#1mm\raise#2mm\hbox{#3}}}


% bibibliography
\def\bibitem#1&#2&#3&#4&%
{\hangindent=1.2cm\hangafter=1
\noindent\rlap{\hbox{\eightpointbf #1}}\kern1.2cm{\rm #2}{\it #3}{\rm #4.}} 

\openauxfile

\notthispage=\pageno
\title{Théorie élémentaire de l'intégration :}
\title{l'intégrale de Henstock-Kurzweil}
\titlerunning{Théorie élémentaire de l'intégration :
l'intégrale de Henstock-Kurzweil}
\bigskip
\centerline{\twelvebf Jean-Pierre Demailly}\medskip
\centerline{\twelverm  Université Joseph Fourier Grenoble I}
\smallskip
\centerline{\tt 
http://www-fourier.ujf-grenoble.fr/$\,\tilde{}\,$demailly/books.html}
\medskip
\centerline{version du 3 mars 2009}
\vskip1cm

\section{Introduction}
\bigskip

L'objectif de ce texte est de proposer une «\?trame\?» pour
l'enseignement de l'intégration depuis le lycée jusqu'aux
premières années de l'université. Pour cela, nous développons
les bases de la théorie de l'intégration telles qu'elles ont
été posées et grandement éclaircies par Jaroslav Kurzweil et
Ralph Henstock à la fin des années 1950. Au fil des chapitres, le niveau
mathématique de l'exposition glisse progressivement d'un niveau très
élémentaire jusqu'à un niveau de second cycle universitaire.

Même si au début une partie des résultats doit être admise ou
démontrée de manière heuristique du fait des contraintes de
temps ou des prérequis, nous pensons que la démarche
mathématique utilisée dans l'enseignement doit respecter chaque
fois que cela est possible les principes d'une progression par
généralisations successives compatibles avec les exposés qui ont
précédé («\?progression concentrique\?»). Il est donc
très utile d'introduire dès le début des définitions qui sont
susceptibles d'être rendues rigoureuses et formalisées, et d'adopter
un ordre de présentation des concepts et une articulation logique
tels que la théorie n'aura pas à être substantiellement
changée le jour où viendra la formalisation complète.%
\note{1}{%
À l'heure actuelle, l'intégration est souvent
abordée en plusieurs étapes qui sont les suivantes~:\\
a) En terminale, une première étape qui consiste à introduire
l'intégrale comme «\?aire sous la courbe\?», avec un état d'esprit
qui se ressent obligatoirement de l'appau\-vris\-sement continuel de
la conceptu\-alisation depuis 2 décennies. Il en résulte qu'il est
devenu très difficile de formaliser complètement la théorie, ce
qui veut probablement dire qu'on ne peut guère espérer que le
cours donne de véritables démonstrations, mais seulement au mieux
quelques indications de preuves complétées par des
considérations heuristiques.\\
b) Dans les premières années d'université, les enseignants
présentent en général une version plus ou moins édulcorée de
la théorie de «\?l'intégrale de Riemann\?», à l'aide
d'encadrements par des fonctions en escalier, et des preuves qui
tendent de plus en plus à disparaître du fait du recul des
connaissances fondamentales requises (pratique des $\varepsilon$ et
$\delta$, continuité uniforme, ...)\\
c) En Master 1ère année apparaîtra dans les bons cas une
théorie plus solide de l'inté\-gration reposant sur la théorie
de la mesure et l'intégrale de Lebesgue. Mais il est de
notoriété publique que ce sujet qui fâche a tendance aujourd'hui
à être de moins en moins traité, surtout dans les filières
dites «\?Master enseignement\?» .
\\
Cette situation présente de nombreux inconvénients. La théorie
de l'intégrale de Riemann n'est pas une «\?bonne théorie\?», ni du
point de vue didactique ni du point de vue mathématique. La
présentation n'en est pas très simple~: il faut mani\-puler
constamment des encadrements de fonctions, utiliser la continuité
uniforme pour démontrer l'intégrabilité des fonctions continues,
faire des découpages de $\varepsilon$ et $\delta$ parfois peu
éclai\-rants.  Il y a de nombreuses restrictions ou pathologies, des
théorèmes essentiels comme ceux de la convergence monotone ne sont
pas valables, etc.  Plus tard, l'introduction de l'intégrale de
Lebesgue viendra balayer ce travail en montrant qu'il s'agissait en
fait d'une théorie bancale et incomplète. Si les étudiants
échappent à l'intégrale de Lebesgue -- comme cela arrive à un
nombre de plus en plus grand de CAPESiens -- ils n'auront donc jamais
eu l'occasion de se voir exposer une théorie «\?sérieuse\?»  de
l'intégration, ce qui est préoccupant.}

Le choix de l'intégrale de Henstock-Kurzweil présente l'avantage
de fournir des défini\-tions assez simples -- peut-être plus
simples que celle de Riemann puisque les encadre\-ments de fonctions
ne sont plus nécessaires, que l'on n'a plus besoin de la
continuité uniforme, que tous les théorèmes de base se
démontrent en quelques lignes -- et, en même temps, d'être assez
puissante pour contenir les parties élémentaires de la théorie
de Lebesgue~... Dans ces conditions, il paraît quelque peu
anachronique que la théorie n'ait pas encore trouvé sa juste place
dans l'enseignement$\,$!

Nous suivons ici d'assez près le livre «\?Introduction to gauge
integrals\?» [Sw] de Charles Swartz, en l'allé\-geant autant que
faire se peut, pour atteindre très rapidement la preuve des
théorèmes fondamentaux (rapport entre intégration et primitive,
intégration par parties, changement de variable, dérivabilité
des intégrales indéfinies de fonctions continues...).  Nous
développons ensuite les résultats plus spécifiques à la
théorie de Henstock-Kurzweil pour atteindre les théorèmes de
convergence monotone et dominée.  L'existence de la mesure de
Lebesgue et ses propriétés fondamentales figurent parmi les
conséquences directes, sans qu'il y ait besoin d'introduire au
préalable le langage général des tribus et des mesures
dénombrablement additives. Les étudiants auront donc en fait un
premier exemple motivant sous la main lorsque ces notions plus
générales seront introduites. Enfin, les définitions ad hoc des
diverses intégrales généralisées, impropres et
semi-convergentes deviennent également accessoires, puisque toutes
ces notions peuvent être exprimées en une seule définition
naturelle contenant les cas utiles~: l'intégrale de
Henstock-Kurzweil autorise par nature même la «\?semi-convergence\?» ...

Les premières étapes nous paraissent éventuellement utilisables au
lycée, à condition d'ad\-mettre quelques-unes des démonstrations
-- et en prenant comme perspective que c'est l'inté\-grale de
Henstock-Kurzweil qui sera développée ensuite, de sorte que les
énoncés présentant des hypothèses artificielles superflues
n'ont pas lieu d'être. 

Le cours qui suit a été à l'origine inspiré par des notes
synthétiques rédigées par Eric Charpentier [Ch] à
l'Univer\-sité de Bordeaux autour de 2002, et fait des emprunts à de
multiples sources (cf.\ bibliographie). Ces notes ont été
ensuite développées sous forme de cours polycopié par Jean-Yves
Briend à Marseille [Br] (après que je l'ai informé des
suggestions d'Eric Charpentier). Le présent texte  
a fait l'objet de plusieurs rédactions successives
depuis l'automne 2005, et a lui-même inspiré ultérieurement des
cours ou manuels mis en chantier par plusieurs collègues. Je
voudrais dans ce cadre signaler d'utiles remarques et questions
formulées par Xavier Buff, auteur du chapitre sur l'intégration 
pour le L2 dans la collection de manuels ``Licence-Tout-en-Un''
dirigée par Jean-Pierre Ramis et André Warusfel [RW], et remercier ces
deux derniers pour leur intérêt et leurs encouragements.
\vfill\eject

\section{\fourteenbf Table des matières}
\sectionrunning{Table des matières}
\bigskip
\sectref{0}
\sectref{1}
\vskip7pt

{\bf Chapitre I\\
Définitions et résultats fondamentaux. Cas des fonctions d'une variable}
\smallskip

\sectref{2}
\sectref{3}
\sectref{4}
\sectref{5}
\sectref{6}
\sectref{7}
\sectref{8}
\sectref{9}
\sectref{10}
\sectref{11}
\vskip7pt

{\bf Chapitre II\\
Calcul des intégrales en plusieurs variables}
\smallskip

\sectref{12}
\sectref{13}
\sectref{14}
\bigskip 

{\bf Chapitre III\\
Théorèmes généraux de convergence, espaces 
$\hbox{\tenbfit L}^{\hbox{\sevenbfit p}}$ et fonctions mesurables}

\smallskip
\sectref{15}
\sectref{16}
\sectref{17}
\sectref{18}
\sectref{19}
\sectref{20}
\sectref{21}
\sectref{22}
\sectref{23}
\sectref{24}
\sectref{25}
\vskip7pt

{\bf Chapitre IV\\
Compléments historiques}
\smallskip

\sectref{26}
\sectref{27}
\sectref{28}
\sectref{29}
\sectref{30}
\medskip

\sectref{31}
\sectref{32}

\chapterjump

\chapterrunning{I.}
\phantom{$\ $}
\bigskip
\centerline{\fourteenbf Chapitre I}
\bigskip
\centerline{\fourteenbf Définitions et résultats fondamentaux}
\bigskip
\centerline{\fourteenbf Cas des fonctions d'une variable}
\vskip3cm

L'objectif de ce chapitre est de proposer une présentation rigoureuse
et complète des premiers éléments de la théorie de
l'intégration. Compte tenu de cette ambition, l'exposé est
nécessairement théorique, et donc beaucoup plus exigeant que
d'autres textes ou manuels qui se contentent de donner des techniques
de calcul, et qui s'appuient seulement sur une intuition de la notion
d'aire en lieu et place de justifications mathé\-ma\-tiques
complètes. Un prérequis indispensable est d'avoir déjà
assimilé l'art de couper les $\varepsilon$ en quatre -- ou d'être
prêt à faire l'effort de creuser la question. Le public visé est
celui des élèves de Terminale très motivés -- la théorie de base 
ne fait jamais appel
à aucune notion qui dépasse le niveau du lycée. La plupart des
notes de bas de page sont destinés à des lecteurs plus avancés et 
ne peuvent normalement pas être comprises par des personnes qui
aborderaient la théorie pour la première fois$\,$; de même, les
passages marqués d'un * ou de deux ** peuvent être omis en
première lecture$\,$; les sections 7~et 8 sont moins élémentaires
et correspondent plutôt à un niveau de première année d'université.
\bigskip

\section{1. Sommes de Riemann}

Dans toute cette section, $a$ et $b$ désignent deux réels tels que $a<b$.
Soit $f$ une fonction, définie sur l'intervalle $[a,b]$, à
valeurs dans $\bR$. La portion du plan comprise entre le graphe de $f$
et l'axe horizontal est l'ensemble des couples $(x,y)$ tels que 
$$
0\le y\le f(x)~~\hbox{si $f(x)\ge 0$},\qquad
f(x)\le y\le 0~~\hbox{si $f(x)\le 0$}.
$$
Pour une fonction $f$ suffisamment régulière, nous souhaitons
évaluer l'aire $A$ de cette portion de plan, en comptant
positivement les surfaces situées au-dessus de l'axe
horizontal, et négativement celles situées
au-dessous (Fig.~1). Nous parlerons de «\?l'aire 
algébrique\?»\note{2}{%
L'approche des intégrales par les aires nous
paraît infiniment préférable à celle qui consiste à
introduire a priori l'intégrale par le calcul des primitives, ne
serait-ce que parce que cette façon de voir dépouille
l'intégrale de son sens géométrique (et qu'en outre elle
escamote l'unique façon de démontrer en général l'existence
des primitives...)} située sous le graphe de $f$.

\InsertFig 10.000 65.000 {
1 mm unit
 0.900 setgray
   18.000  30.000 moveto  18.000  24.000 lineto 
[  18.000  24.000   25.000  14.000   43.000  49.000   60.000  16.000  
   75.000  40.000   80.000  40.000  ] curve 
   80.000  30.000 lineto
closepath fill
 0.000 setgray
  5.000  30.000 moveto 
 97.000   0.000 2.4 vector 
 10.000   5.000 moveto 
 55.000  90.000 2.4 vector 
 stroke
  0.200 setlinewidth
 18.000  24.000 moveto 
[  18.000  24.000   25.000  14.000   43.000  49.000   60.000  16.000  
   75.000  40.000   80.000  40.000  ] curve 
stroke 
 18.000  30.000 moveto   0.700  0.000 indent 
 80.000  30.000 moveto   0.700  0.000 indent 
[   1.000   0.500 ] 0 setdash 
 18.000  28.500 moveto  18.000  24.000 lineto stroke
 80.000  31.500 moveto  80.000  40.000 lineto stroke
}
\LabelTeX   17.000  32.500 $a$\ELTX
\LabelTeX   79.300  26.000 $b$\ELTX
\LabelTeX  100.500  26.200 $x$\ELTX
\LabelTeX    6.200  58.000 $y$\ELTX
\LabelTeX   46.200  49.800 $f$\ELTX
\LabelTeX   22.000  22.000 $A_1^{(-)}$\ELTX
\LabelTeX   39.000  37.000 $A_2^{(+)}$\ELTX
\LabelTeX   56.000  22.000 $A_3^{(-)}$\ELTX
\LabelTeX   71.500  34.000 $A_4^{(+)}$\ELTX
\LabelTeX   20.000   6.000 $A=A_1+A_2+A_3+A_4=-|A_1|+|A_2|-|A_3|+|A_4|$\ELTX
\EndFig
\centerline{{\bf Fig.~1.} Aire algébrique située sous le graphe de $f$.}
\medskip

L'idée est de découper l'intervalle $[a,b]$ au moyen d'une subdivision
en sous-intervalles $[a_j,a_{j+1}]$, puis de sommer les aires de rectangles
basés sur les intervalles $[a_j,a_{j+1}]$. La~figure 2 ci-dessous
résume le procédé.

\InsertFig 10.000 66.000 {
/riem {/y exch 30.0 add def /a2 exch def /a1 exch def
   a1 30.000 moveto  a1 y lineto  a2 y lineto  a2 30.000 lineto } def
1 mm unit
 0.900 setgray
   18.000  30.000 moveto  18.000  24.000 lineto 
[  18.000  24.000   25.000  14.000   43.000  49.000   60.000  16.000  
   75.000  40.000   80.000  40.000  ] curve 
   80.000  30.000 lineto
closepath fill
  1.000   0.840   0.840 setrgbcolor
 44.000  49.000  17.000 riem fill
 0.000 setgray
 49.000  53.000 moveto   0.000 180.000 2.4 vector
 44.000  53.000 moveto   0.000   0.000 2.4 vector
 44.000  53.000 moveto  49.000  53.000 lineto stroke
  5.000  30.000 moveto  97.000   0.000 2.4 vector 
 10.000   5.000 moveto  55.000  90.000 2.4 vector 
  0.200 setlinewidth
 18.000  24.000 moveto 
[  18.000  24.000   25.000  14.000   43.000  49.000   60.000  16.000  
   75.000  40.000   80.000  40.000  ] curve 
stroke 
  0.113 setlinewidth
  1.000   0.000   1.000 setrgbcolor
 18.000  23.000 -10.000 riem stroke
 23.000  27.000 -16.000 riem stroke
 27.000  32.000 -15.000 riem stroke
 32.000  36.000   5.000 riem stroke
 36.000  39.000  15.000 riem stroke
 39.000  44.000  19.000 riem stroke
 44.000  49.000  17.000 riem stroke
 49.000  52.000   6.000 riem stroke
 52.000  54.000  -6.000 riem stroke
 54.000  58.000 -12.000 riem stroke
 58.000  63.000 -14.000 riem stroke
 63.000  67.000  -7.000 riem stroke
 67.000  71.000   5.000 riem stroke
 71.000  74.000   9.000 riem stroke
 74.000  80.000  10.000 riem stroke
  0.300 setlinewidth
  1.000   0.000   0.000 setrgbcolor
 18.000   8.000 moveto 0.7  0 indent
 23.000   8.000 moveto 0.7  0 indent
 27.000   8.000 moveto 0.7  0 indent
 32.000   8.000 moveto 0.7  0 indent
 36.000   8.000 moveto 0.7  0 indent
 39.000   8.000 moveto 0.7  0 indent
 44.000   8.000 moveto 0.7  0 indent
 49.000   8.000 moveto 0.7  0 indent
 52.000   8.000 moveto 0.7  0 indent
 54.000   8.000 moveto 0.7  0 indent
 58.000   8.000 moveto 0.7  0 indent
 63.000   8.000 moveto 0.7  0 indent
 67.000   8.000 moveto 0.7  0 indent
 71.000   8.000 moveto 0.7  0 indent
 74.000   8.000 moveto 0.7  0 indent
 80.000   8.000 moveto 0.7  0 indent
 18.000  30.000 moveto 0.7  0 indent
 23.000  30.000 moveto 0.7  0 indent
 27.000  30.000 moveto 0.7  0 indent
 32.000  30.000 moveto 0.7  0 indent
 36.000  30.000 moveto 0.7  0 indent
 39.000  30.000 moveto 0.7  0 indent
 44.000  30.000 moveto 0.7  0 indent
 49.000  30.000 moveto 0.7  0 indent
 52.000  30.000 moveto 0.7  0 indent
 54.000  30.000 moveto 0.7  0 indent
 58.000  30.000 moveto 0.7  0 indent
 63.000  30.000 moveto 0.7  0 indent
 67.000  30.000 moveto 0.7  0 indent
 71.000  30.000 moveto 0.7  0 indent
 74.000  30.000 moveto 0.7  0 indent
 80.000  30.000 moveto 0.7  0 indent
  0.000 setgray
 10.000  47.000 moveto 0.7  90 indent
  0.000   0.000   1.000 setrgbcolor
 20.000   8.000 moveto 0.5 disk
 25.000   8.000 moveto 0.5 disk
 30.000   8.000 moveto 0.5 disk
 34.000   8.000 moveto 0.5 disk
 37.000   8.000 moveto 0.5 disk
 43.000   8.000 moveto 0.5 disk
 47.000   8.000 moveto 0.5 disk
 51.000   8.000 moveto 0.5 disk
 53.000   8.000 moveto 0.5 disk
 55.500   8.000 moveto 0.5 disk
 60.000   8.000 moveto 0.5 disk
 66.000   8.000 moveto 0.5 disk
 70.000   8.000 moveto 0.5 disk
 72.500   8.000 moveto 0.5 disk
 77.000   8.000 moveto 0.5 disk
 20.000  30.000 moveto 0.5 disk
 25.000  30.000 moveto 0.5 disk
 30.000  30.000 moveto 0.5 disk
 34.000  30.000 moveto 0.5 disk
 37.000  30.000 moveto 0.5 disk
 43.000  30.000 moveto 0.5 disk
 47.000  30.000 moveto 0.5 disk
 51.000  30.000 moveto 0.5 disk
 53.000  30.000 moveto 0.5 disk
 55.500  30.000 moveto 0.5 disk
 60.000  30.000 moveto 0.5 disk
 66.000  30.000 moveto 0.5 disk
 70.000  30.000 moveto 0.5 disk
 72.500  30.000 moveto 0.5 disk
 77.000  30.000 moveto 0.5 disk
  0.000 setgray
  0.113 setlinewidth
 15.000   8.000 moveto  85.000   8.000 lineto stroke
 [ 1.000 0.500 ] 0 setdash
 11.500  47.000 moveto  43.700  47.000 lineto stroke
 47.000  47.000 moveto  47.000  31.000 lineto stroke
  1.000   0.000   1.000 setrgbcolor
 44.000   9.000 moveto  44.000  29.000 lineto stroke
 49.000   9.000 moveto  49.000  29.000 lineto stroke
}
\LabelTeX   17.000  32.500 $a$\ELTX
\LabelTeX   79.300  26.000 $b$\ELTX
\LabelTeX  100.500  26.200 $x$\ELTX
\LabelTeX    6.200  58.000 $y$\ELTX
\LabelTeX    0.000  46.000 $f(x_j)$\ELTX
\LabelTeX   52.000  40.200 $f$\ELTX
\LabelTeX   17.000   5.000 $\RGBColor{1 0 0}{a_0}$\ELTX
\LabelTeX   42.800   5.000 $\RGBColor{1 0 0}{a_j}$\ELTX
\LabelTeX   48.000   5.000 $\RGBColor{1 0 0}{a_{j+1}}$\ELTX
\LabelTeX   79.000   5.000 $\RGBColor{1 0 0}{a_N}$\ELTX
\LabelTeX   45.200  26.800 $\RGBColor{0 0 1}{x_j}$\ELTX
\LabelTeX   45.200  10.600 $\RGBColor{0 0 1}{x_j}$\ELTX
\LabelTeX   45.800  55.800 $h_j$\ELTX
\LabelTeX   87.200   7.500 $\Big\}D$\ELTX
\EndFig
\centerline{{\bf Fig.~2.} Somme de Riemann associée à $f$ sur $D$.}
\vskip4mm

La somme des aires des rectangles figurés ci-dessus est donnée par
$\displaystyle
\smash{\sum_{j=0}^{N-1} f(x_j)(a_{j+1}-a_j)},$
et on est ainsi conduit à poser la définition suivante.
\medskip

{\bf (1.1) Définition.} {\it 
{\parindent=6.5mm
\item{\rm (a)} On appelle «\?subdivision pointée\?» de 
l'intervalle $[a,b]$ la donnée
de $N+1$ points
$$
a=a_0<a_1<\ldots<a_{N-1}<a_N=b
$$
et de $N$ points $x_0,\,x_1,\ldots,\,x_{N-1}$ tels que
$$
\forall j=0,1,\ldots,N-1,\qquad x_j\in[a_j,a_{j+1}].
$$
Elle sera notée
$$
D=\{([a_j,a_{j+1}],x_j)\}_{0\le j<N}.
$$
Les réels $h_j=a_{j+1}-a_j$ $($amplitudes des intervalles$)$ sont les
«\?pas\?» de la subdivision.
\smallskip
\item{\rm (b)} Soit $D$ une subdivision pointée de l'intervalle $[a,b]$ 
et $f$ une fonction de $[a,b]$ dans~$\bR$. On appelle «\?somme de 
Riemann\?» associée à $f$ sur $D$, le réel
$$
\boxed{18}{
S_D(f) = \sum_{j=0}^{N-1} f(x_j)(a_{j+1}-a_j)=
\sum_{j=0}^{N-1} f(x_j)\,h_j.}
$$
}}

La somme de Riemann $S_D(f)$ est l'aire algébrique de la réunion
des rectangles de largeur $h_j$ et de hauteur $f(x_j)$ (Fig.~2). 
Il s'agit bien d'une aire algébrique, 
puisque $f(x_j)h_j$ est compté positivement si $f(x_j)>0$ et
négativement si $f(x_j)<0$. 

Intuitivement l'aire $A$ cherchée est la limite de $S_D(f)$ quand
les pas $h_j$ tendent vers~$0$. Un choix possible consiste par exemple
à prendre une subdivision en sous-intervalles égaux
$$
a_j=a+jh=a+j{b-a\over N},\quad 0\le j\le N\quad\hbox{où}\quad
h_j=h={b-a\over N},
$$ 
que l'on peut combiner avec un choix quelconque des points $x_j$.
\medskip

{\bf (1.2) Exemple.} Comme premier exemple, considérons la fonction 
identité $f(x)=x$ sur l'intervalle $[0,1]$. Pour $N\geq 1$, posons~:
$$
a_0=0\,,\;a_1={1\over N}\,,\ldots,\;a_j={j\over N}\,,\ldots,\;
a_N=1
$$
Les pas de cette subdivision sont tous égaux à $1/N$. Voici trois
calculs de sommes de Riemann, selon que l'on place les points $x_j$ au
début, au milieu ou à la fin des intervalles $[a_j,a_{j+1}]$
(rappelons que la somme des $N$ premiers entiers vaut $N(N+1)/2$).
$$
\leqalignno{
&\kern15pt x_j=a_j~:\kern49pt
S_D(f) = \sum_{j=0}^{N-1} {j\over N}\,{1\over N}
= {1\over N^2}\sum_{j=0}^{N-1} j = {N-1\over 2N}\;,
&(1.2\,{\rm a})\cr
&\kern15pt x_j={a_j+a_{j+1}\over 2}~:\kern15pt
S_D(f) = \sum_{j=0}^{N-1}{2j+1\over 2N}\,{1\over N}
= {1\over 2N^2}\sum_{j=0}^{N-1} 2j+1 = {1\over 2}\;,
&(1.2\,{\rm b})\cr
&\kern15pt x_j=a_{j+1}~:\kern40pt
S_D(f) = \sum_{j=0}^{N-1} {j+1\over N}\,{1\over N}
= {1\over N^2}\sum_{j=0}^{N-1} j+1 = {N+1\over 2N}\;.
&(1.2\,{\rm c})\cr} 
$$
La seconde somme est égale à $1/2$ pour tout $N$, les deux autres
tendent vers $1/2$ quand $N$ tend vers l'infini. L'aire du triangle
sous le graphe de la fonction est bien $1/2\;$:

\InsertFig 30.000 59.000 {
/riem {/y exch 10.0 add def /a2 exch def /a1 exch def
   a1 10.000 moveto  a1 y lineto  a2 y lineto  a2 10.000 lineto } def
1 mm unit
 1 0 0 setrgbcolor
 10.000  15.000   5.000 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 15.000  20.000  10.000 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 20.000  25.000  15.000 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 25.000  30.000  20.000 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 30.000  35.000  25.000 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 35.000  40.000  30.000 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 40.000  45.000  35.000 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 45.000  50.000  40.000 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 0 1 0 setrgbcolor
 10.000  15.000   2.500 riem gsave 0.9 1 0.9 setrgbcolor fill grestore stroke
 15.000  20.000   7.500 riem gsave 0.9 1 0.9 setrgbcolor fill grestore stroke
 20.000  25.000  12.500 riem gsave 0.9 1 0.9 setrgbcolor fill grestore stroke
 25.000  30.000  17.500 riem gsave 0.9 1 0.9 setrgbcolor fill grestore stroke
 30.000  35.000  22.500 riem gsave 0.9 1 0.9 setrgbcolor fill grestore stroke
 35.000  40.000  27.500 riem gsave 0.9 1 0.9 setrgbcolor fill grestore stroke
 40.000  45.000  32.500 riem gsave 0.9 1 0.9 setrgbcolor fill grestore stroke
 45.000  50.000  37.500 riem gsave 0.9 1 0.9 setrgbcolor fill grestore stroke
 0 0 1 setrgbcolor
  0.250 setlinewidth
 10.000  10.200 moveto  15.000  10.200 lineto stroke
  0.113 setlinewidth
 15.000  20.000   5.000 riem gsave 0.9 0.9 1 setrgbcolor fill grestore stroke
 20.000  25.000  10.000 riem gsave 0.9 0.9 1 setrgbcolor fill grestore stroke
 25.000  30.000  15.000 riem gsave 0.9 0.9 1 setrgbcolor fill grestore stroke
 30.000  35.000  20.000 riem gsave 0.9 0.9 1 setrgbcolor fill grestore stroke
 35.000  40.000  25.000 riem gsave 0.9 0.9 1 setrgbcolor fill grestore stroke
 40.000  45.000  30.000 riem gsave 0.9 0.9 1 setrgbcolor fill grestore stroke
 45.000  50.000  35.000 riem gsave 0.9 0.9 1 setrgbcolor fill grestore stroke
  0.0 setgray
  5.000  10.000 moveto  60.000   0.000 2.4 vector 
 10.000   5.000 moveto  48.000  90.000 2.4 vector 
  0.250 setlinewidth
 10.000  10.000 moveto  50.000  50.000 lineto stroke
}
\LabelTeX   7.200   6.400 $0$\ELTX
\LabelTeX  63.200   6.400 $x$\ELTX
\LabelTeX  49.200   6.400 $1$\ELTX
\LabelTeX   1.500  50.000 $f(x)$\ELTX
\EndFig
\centerline{{\bf Fig.~3.} 
Sommes de Riemann associées à l'identité sur $[0,1]$.}
\medskip

{\bf (1.3) Exemple*.} Nous considérons ici une situation où la fonction $f$
n'est plus bornée. On prend $[a,b]=[0,1]$ et $f$ telle que
$f(x)=1/\sqrt{x}$ si $x\in{}]0,1]$ et $f(0)=0$. On introduit une subdivision 
pointée $D=\{([a_j,a_{j+1}],x_j)\}_{0\le j<N}$ telle que $a_j=(j/N)^2$
pour $0\le j\le N$ et on pose $x_j=(t_j/N)^2$ avec $t_j\in[j,j+1]$.
On a alors  $a_{j+1}-a_j=(2j+1)/N^2$ et $f(x_j)=N/t_j$ si $t_j>0$, d'où
$$
S_D(f)={1\over N}\sum_{0\le j\le N-1,\,t_j>0}{2j+1\over t_j}.
$$
\InsertFig 30.000 54.000 {
/riem {/y exch 0.5 mul 10.0 add def /a2 exch def /a1 exch def
   a1 10.000 moveto  a1 y lineto  a2 y lineto  a2 10.000 lineto } def
1 mm unit
 1 0 0 setrgbcolor
 10.000  10.625  80.000 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 10.625  12.500  26.667 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 12.500  15.625  16.000 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 15.625  20.000  11.429 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 20.000  25.625   8.889 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 25.625  32.500   7.273 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 32.500  40.625   6.154 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 40.625  50.000   5.333 riem gsave 1 0.9 0.9 setrgbcolor fill grestore stroke
 0 0 1 setrgbcolor
 10.000  10.625  40.000 riem gsave 0.9 0.9 1 setrgbcolor fill grestore stroke
 10.625  12.500  20.000 riem gsave 0.9 0.9 1 setrgbcolor fill grestore stroke
 12.500  15.625  13.333 riem gsave 0.9 0.9 1 setrgbcolor fill grestore stroke
 15.625  20.000  10.000 riem gsave 0.9 0.9 1 setrgbcolor fill grestore stroke
 20.000  25.625   8.000 riem gsave 0.9 0.9 1 setrgbcolor fill grestore stroke
 25.625  32.500   6.667 riem gsave 0.9 0.9 1 setrgbcolor fill grestore stroke
 32.500  40.625   5.714 riem gsave 0.9 0.9 1 setrgbcolor fill grestore stroke
 40.625  50.000   5.000 riem gsave 0.9 0.9 1 setrgbcolor fill grestore stroke
  0.0 setgray
  5.000  10.000 moveto  60.000   0.000 2.4 vector 
 10.000   5.000 moveto  48.000  90.000 2.4 vector 
  0.250 setlinewidth
 10.356  50.000 moveto 
[  10.356  50.000   10.428  40.000   10.625  30.000   12.500  20.000   
   15.625  16.667   20.000  15.000   25.625  14.000   32.500  13.333
   40.625  12.857   50.000  12.500  ] curve 
stroke 
 10.000  10.000 moveto  0.400 disk
 10.000  12.500 moveto  0.400 90.0 indent
}
\LabelTeX   7.200   6.400 $0$\ELTX
\LabelTeX   7.200  11.700 $1$\ELTX
\LabelTeX  63.200   6.400 $x$\ELTX
\LabelTeX  49.200   6.400 $1$\ELTX
\LabelTeX   1.500  50.000 $f(x)$\ELTX
\EndFig
\centerline{{\bf Fig.~4.} 
Sommes de Riemann associées à $f(x)=1/\sqrt{x}$ sur $[0,1]$.}
\medskip
\noindent
Le choix le plus simple est $\RGBColor{1 0 0}{t_j=j+{1\over 2}}$, 
qui donne $\smash{{2j+1\over t_j}}=2$ et donc $S_D(f)=2$. Si on choisit 
plutôt $\RGBColor{0 0 1}{t_j=j+1}$,
on obtient la valeur minimale
possible pour $S_D(f)$, mais comme $\smash{{2j+1\over j+1}}\to 2$ quand
$j\to+\infty$, il est facile de voir que l'on a encore $S_D(f)\to 2$
pour $N\to+\infty$ (on peut observer par exemple que
$\smash{{2j+1\over j+1}}=2-\smash{{1\over j+1}}\ge 2-1/\sqrt{N}$ pour 
$\sqrt{N}\le j\le N$). Comme $a_{j+1}-a_j\le (2N-1)/N^2\to 0$
quand $N\to+\infty$, ce
calcul amène à penser que l'aire
du domaine non borné défini par $0<x\le 1$ et $0\le
y\le 1/\sqrt{x}$ est bien finie et égale à~$2$.\qed
\smallskip

Dans la suite, nous aurons besoin pour des raisons à la fois
théoriques et pratiques de considérer des sommes de Riemann
sur des subdivisions arbitraires. Il est facile de voir à
partir de la définition 1.1$\,$(b) que ces sommes
vérifient les propriétés suivantes.
\medskip

{\bf (1.4) Propriétés fondamentales.} {\it 
{\parindent=6.5mm
\item{\rm (a)} {\rm Linéarité.}
Si $f,g:[a,b]\to \bR$ sont des fonctions 
quelconques et $\lambda$,~$\mu$ des constantes réelles, alors
$$
\boxed{9}{S_D(\lambda f+\mu g)=\lambda S_D(f) +\mu S_D(g).}
$$
\item{\rm (b)} {\rm Monotonie.}
Si $f,g:[a,b]\to \bR$ sont des fonctions quelconques, alors
$$
\boxed{9}{f\ge g\quad \Rightarrow\quad S_D(f)\ge S_D(g).}
$$
En particulier, si $f\ge 0$, alors $S_D(f)\ge 0$.
\item{\rm (c)} {\rm Formule de Chasles.}
Soient $a<b<c$ des réels et $f$ une fonction définie sur $[a,c]$.
Si $D_1$ est une subdivision pointée de $[a,b]$ et $D_2$ une subdivision 
pointée de $[b,c]$, alors $D_1\cup D_2$
est une subdivision pointée de $[a,c]$ et
$$
\boxed{9}{S_{D_1\cup D_2}(f)=S_{D_1}(f) +S_{D_2}(f).}
$$}}

\section{2. Définition de l'intégrale d'une fonction}

La première idée qui vient à l'esprit est de considérer des
subdivisions pointées \hbox{$D=\{([a_j,a_{j+1}],x_j)\}_{0\le j<N}$}
dont les pas $h_j=a_{j+1}-a_j$ sont tels que $0<h_j\le\delta$ avec
$\delta$ tendant vers $0$, et de regarder si les sommes de Riemann de
Riemann $S_D(f)$ convergent bien vers une limite $A$. Cette limite sera alors
interprétée comme étant l'aire cherchée. On aboutit à
la définition suivante, qui est la définition historiquement
introduite par Cauchy et Riemann.

{\bf (2.1) Définition}. {\it Soit $f:[a,b]\to\bR$ une fonction quelconque.
On dit que $f$ est intégrable au sens de Riemann $($ou 
Riemann-intégrable$)$ s'il exis\-te un réel $A$ qui représente 
l'aire algébrique
située sous le graphe de $f$, tel que pour toute marge d'erreur
$\varepsilon>0$ donnée a priori, on peut trouver un réel
$\delta>0$ tel que pour toute subdivision pointée 
$D=\{([a_j,a_{j+1}],x_j)\}$ de $[a,b]$ on ait
$$
h_j=a_{j+1}-a_j\le\delta~~
\Rightarrow~~ |S_D(f)-A|\le\varepsilon.
$$
Le nombre réel $A$ de la définition 
précédente  est appelé intégrale de $f$ sur $[a,b]$ et noté
$$
A=\int_a^b f(x)\,dx.
$$
et on dit que $\smash{\int_a^b f(x)\,dx}$ est la limite des sommes 
de Riemann $S_D(f)$, lorsque le pas de la subdivision tend vers~$0$.}
\medskip

Dans cette définition, on peut par exemple se contenter de prendre une
subdi\-vision en $N$ sous-intervalles de pas constant $h={b-a\over N}$, 
et on obtient alors la conséquence immédiate suivante.
\medskip

{\bf (2.2) Convergence des sommes de Riemann.} {\it
Si $f:[a,b]\to\bR$ est une fonction intégrable au sens de Riemann, on a
$$
\boxed{16}{
\eqalign{
\int_a^bf(x)\,dx
&=\lim_{N\to+\infty}{b-a\over N}\sum_{j=0}^{N-1}f\Big(a+{j\over N}(b-a)\Big)
\kern37pt\hbox{$[$cas $x_j=a_j]$}\cr
&=\lim_{N\to+\infty}{b-a\over N}\sum_{j=1}^Nf\Big(a+{j\over N}(b-a)\Big)
\kern41pt\hbox{$[$cas $x_j=a_{j+1}]$}\cr
&=\lim_{N\to+\infty}{b-a\over N}\sum_{j=0}^{N-1}f\Big(a+{2j+1\over 2N}(b-a)
\Big)
\kern20pt\hbox{$\Big[$cas $\dsp x_j={a_j+a_{j+1}\over 2}\Big]$.}\cr
}}
$$}

Si l'aire $\int_a^bf(x)\,dx$ située sous le graphe de $f$ est connue
d'une manière ou d'une autre, on peut alors en déduire la valeur des
limites correspondantes$\,$; il faut savoir pour cela que la fonction
$f$ est intégrable au sens de Riemann, on démontrera plus tard
(cf.\ théorèmes 7.6 et 7.10) que c'est le cas si $f$ est 
continue ou continue par morceaux.
\medskip

{\bf (2.3) Exemple.} Considérons la somme
$$
{1\over N^2}\left(\sqrt{1\,(N-1)} + \sqrt{2\,(N-2)}
+ \ldots + \sqrt{(N-1)\,1}\;\right)
$$
qui peut aussi s'écrire~:
$$
{1\over N}\left(\sqrt{{1\over N}\left(1-{1\over N}\right)} +
\sqrt{{2\over N}\left(1-{2\over N}\right)} + \ldots +
\sqrt{\left(1-{1\over N}\right){1\over N}}\;\right).
$$
C'est une somme de Riemann associée à la fonction
$\dsp{x\rightarrow \sqrt{x(1-x)}}$ sur l'intervalle $[0,1]$. 
Sa limite, lorsque $n$ tend vers $+\infty$, est égale à~:
$\smash{\int_{0}^{1}\sqrt{x(1-x)}\, dx}$.
Or, le graphe $y=\sqrt{x(1-x)}$ de cette fonction est un demi-arc
du cercle $x^2-x+y=0$, soit encore 
$(x-{1\over 2})^2+y^2={1\over 4}$, c'est donc un demi-cercle 
de centre $\smash{{1\over 2}}$ et de rayon
$\smash{{1\over 2}}$. La limite de la sommation est égale à
l'aire du demi-disque, qui vaut $\pi/8$.\qed
\medskip

Cependant, on s'aperçoit assez vite que la définition de
l'intégrabilité au sens de Riemann impose des restrictions
assez gênantes sur la fonction~$f\,$:
\medskip

{\bf (2.4) Condition nécessaire.} {\it Toute fonction $f$ 
Riemann-intégrable est~bornée. }

{\it Démonstration.} En effet, selon la définition 2.1, 
prenons $\delta>0$ donnant une erreur au plus $\varepsilon$.
Pour une subdivision $D$ de pas constant $h\le\delta$, à savoir 
$h=(b-a)/N$ avec $N\ge(b-a)/\delta$, nous devons avoir la majoration
$|S_D(f)-A|\le\varepsilon$, donc
$$
|S_D(f)|=\Big|{b-a\over N}\sum_{0\le j<N}f(x_j)\Big|\le |A|+\varepsilon
~~\Rightarrow
\bigg|\sum_{0\le j<N}f(x_j)\bigg|\le{N\over b-a}(|A|+\varepsilon),
$$
ceci pour tout choix des points 
$x_j\in[a_j,a_{j+1}]$. Choisissons pour l'un des points $x_j$ un
point $x\in[a,b]$ quelconque, et pour les autres les points $a_j$ de
la subdivision. Il vient alors
$$
\forall x\in[a,b],\qquad |f(x)|\le \sum_{0\le j<N}|f(a_j)|
+{N\over b-a}(|A|+\varepsilon),
$$
ce qui montre que $f$ doit être bornée.\qed
\medskip

Cette restriction que $f$ soit bornée est très gênante, puisqu'on 
a vu à l'exemple (1.3) qu'il existait des fonctions non
bornées pour lesquelles l'aire située sous le graphe est
finie et calculable sans difficulté. D'autre part, d'un point de vue
concret de calcul numérique,
on peut être amené à faire des calculs d'aires pour des fonctions
bornées qui «\?oscillent plus\?» à certains endroits
qu'à d'autres~:

\vbox{%
\InsertFig 10.000 66.000 {
/riem {/y exch 10.0 add def /a2 exch def /a1 exch def
   a1 10.000 moveto  a1 y lineto  a2 y lineto  a2 10.000 lineto } def
1 mm unit
  1.000   0.840   0.840 setrgbcolor
 27.000  32.000  22.000 riem fill
  0.000 setgray
  5.000  10.000 moveto  97.000   0.000 2.4 vector 
 10.000   5.000 moveto  55.000  90.000 2.4 vector 
 27.000  53.000 moveto  32.000  53.000 lineto stroke
 27.000  53.000 moveto   0.000   0.000 2.4 vector
 32.000  53.000 moveto   0.000 180.000 2.4 vector
  0.200 setlinewidth
 18.000  24.000 moveto 
[  18.000  24.000   25.000  27.000   
   43.000  49.000   44.000  42.000  
   46.000  30.000   46.500  31.000   
   48.400  39.000   49.000  40.000   49.500  39.200   
   51.400  29.000   52.000  28.000   52.500  29.200
   55.400  41.000   56.000  42.000   56.500  39.200   
   60.000  22.000   75.000  40.000   80.000  40.000  ] curve 
stroke 
 10.000  32.000 moveto   0.700  90.000 indent 
 18.000  10.000 moveto   0.700   0.000 indent 
 80.000  10.000 moveto   0.700   0.000 indent 
  0.113 setlinewidth
 [ 1.000 0.500 ] 0 setdash
 27.000  32.500 moveto  27.000 52.500 lineto stroke
 32.000  32.500 moveto  32.000 52.500 lineto stroke
 11.000  32.000 moveto  26.500 32.000 lineto stroke
 29.800  11.000 moveto  29.800 31.500 lineto stroke
 29.800  10.000  moveto 0.5 disk
 [ ] 0 setdash
  1.000   0.000   1.000 setrgbcolor
 18.000  23.000  15.000 riem stroke
 23.000  27.000  17.000 riem stroke
 27.000  32.000  22.000 riem stroke
 32.000  36.000  29.000 riem stroke
 36.000  39.000  36.000 riem stroke
 39.000  41.000  40.000 riem stroke
 41.000  43.000  40.500 riem stroke
 43.000  44.000  37.000 riem stroke
 44.000  45.000  29.000 riem stroke
 45.000  46.000  19.500 riem stroke
 46.000  47.000  21.000 riem stroke
 47.000  48.000  25.000 riem stroke
 48.000  49.000  30.000 riem stroke
 49.000  50.000  29.500 riem stroke
 50.000  51.000  22.000 riem stroke
 51.000  52.000  19.000 riem stroke
 52.000  53.000  18.500 riem stroke
 53.000  54.000  22.000 riem stroke
 54.000  55.000  28.000 riem stroke
 55.000  56.000  31.000 riem stroke
 56.000  57.000  30.500 riem stroke
 57.000  58.000  15.500 riem stroke
 58.000  59.000  13.500 riem stroke
 59.000  63.000  12.000 riem stroke
 63.000  65.000  13.000 riem stroke
 65.000  68.000  18.000 riem stroke
 68.000  71.000  25.000 riem stroke
 71.000  74.000  29.000 riem stroke
 74.000  80.000  30.000 riem stroke
}
\LabelTeX   17.000   6.500 $a$\ELTX
\LabelTeX   79.300   6.500 $b$\ELTX
\LabelTeX  100.500   6.200 $x$\ELTX
\LabelTeX    6.200  58.000 $y$\ELTX
\LabelTeX   53.000  42.000 $f$\ELTX
\LabelTeX   28.300   6.500 $x_j$\ELTX
\LabelTeX   0.000   31.000 $f(x_j)$\ELTX
\LabelTeX  28.000   56.500 $h_j\le\delta(x_j)$\ELTX
\EndFig
\vskip-9pt
\centerline{{\bf Fig.~5.} Somme de Riemann à pas variable.}}
\bigskip

Dans ce cas, on sent bien intuitivement que l'on a 
intérêt à resserrer davantage les pas $h_j$ aux endroits où
$f$ oscille davantage. Plutôt que de supposer que $h_j\le\delta$
où $\delta$ est un réel positif fixé, il vaudra donc mieux demander
que les pas $h_j$ satisfassent
une condition $h_j\le\delta(x_j)$ où $\delta(x_j)$ est une quantité
positive assez petite dépendant de l'endroit où l'on prend le rectangle 
de hauteur~$f(x_j)$. On choisira alors des fonctions $\delta:[a,b]\to\bR_+^*$ 
positives qui serviront à majorer les pas $h_j$. Une telle fonction
sera appelée une {\it jauge} sur $[a,b]$.
\medskip

{\bf (2.5) Définition.} {\it Soit $\delta:[a,b]\to\bR_+^*$ une fonction 
positive quelconque. Une subdivision pointée
$D= \{([a_j,a_{j+1}],x_j)\}_{0\le j<N}$ de $[a,b]$ sera dite
$\delta$-fine si
$$
\forall j=0,1,\ldots,N-1,\qquad h_j=a_{j+1}-a_j\le \delta(x_j).
$$}
\vskip-10pt

Si $\delta_*$ et $\delta$ sont deux jauges telles que
$\delta_*\leq \delta$, alors toute subdivision $\delta_*$-fine 
est aussi \hbox{$\delta$-fine}. 
Le résultat suivant, appelé {\it lemme de Cousin}, affirme que la
définition précédente n'est jamais vide de contenu.
\medskip

{\bf (2.6) Lemme.} {\it Soit $\delta:[a,b]\to\bR^*_+$ une jauge. 
Alors il existe une subdivision pointée $D$ de l'intervalle $[a,b]$
qui est $\delta$-fine.}

{\it Démonstration.${}^*$} Elle est basée sur un procédé de dichotomie.
Nous allons raisonner par l'absurde, en supposant que $[a,b]$ n'admet
pas de subdivision pointée $\delta$-fine.
Posons $a_0=a$ et $b_0=b$. 
Divisons l'intervalle $[a_0,b_0]$ en deux,
et considérons les deux moitiés $[a_0,{a_0+b_0\over 2}]$ et
$[{a_0+b_0\over 2},b_0]$~: si chacune des deux
admettait une subdivision $\delta$-fine, la réunion de ces deux
subdivisions serait une subdivision $\delta$-fine de $[a_0,b_0]$.
Donc l'une des deux moitiés au moins n'admet pas de 
subdivision $\delta$-fine$\;$: on note celle-ci $[a_1,b_1]$.

On itère ensuite le procédé, de manière à construire des intervalles 
emboîtés $[a_k,b_k]$, de longueur $(b-a)/2^k$, dont aucun
n'admet de subdivision $\delta$-fine. Les suites $(a_k)$ et $(b_k)$ sont
adjacentes par construction, donc elles convergent vers la même
limite. Soit $x_0$ cette limite. Puisque $\delta(x_0)>0$, il existe $k_0$ tel
que
$$
[a_{k_0},b_{k_0}]\subset [x_0-{\textstyle{1\over 2}}\delta(x_0),
x_0+{\textstyle{1\over 2}}\delta(x_0)].
$$ 
Donc la subdivision pointée de $[a_{k_0},b_{k_0}]$ formée
seulement de l'intervalle tout entier et du point $x_0$ est 
$\delta$-fine. D'où la contradiction.\note{3}{%
Le lecteur ayant quelques connaissances de topologie aura reconnu
un cas élémentaire du théorème de Borel-Lebesgue relatif à la
compacité du segment $[a,b]$. Cependant, notre but est de rester 
aussi élémentaire que possible -- sans éluder les difficultés --
donc il nous a paru préférable de faire la démonstration dans le cadre
strict des subdivisions pointées. [On notera que celle-ci permet en fait
d'énoncer un résultat un peu plus précis~: {\it pour toute jauge
$\delta$ il existe une subdivision pointée $\delta$-fine de $[a,b]$
formée d'intervalles dont les longueurs sont de la forme 
$\smash{(b-a)/2^{k_j}}$.} En effet, il suffit d'utiliser un raisonnement
par l'absurde avec ce type d'intervalles pour aboutir à une
contradiction.] Quoi qu'il en soit, la démonstration de 2.6 est 
probablement assez difficile pour la classe Terminale, c'est pourquoi nous
l'avons marquée d'un astérisque *, comme toutes les parties plus
délicates qui vont suivre.}\qed
\medskip

{\bf (2.7) Définition}. {\it Soit $f:[a,b]\to\bR$ une fonction quelconque.
On dit que $f$ est intégrable au sens de Henstock-Kurzweil $($ou 
HK-intégrable$)$ s'il exis\-te un réel $A$ qui représente l'aire
algébrique située sous le graphe de $f$, tel que pour toute marge d'erreur
$\varepsilon>0$ donnée a priori, on peut trouver une
jauge $\delta:[a,b]\to\bR^*_+$ en sorte que
pour toute subdivision pointée $D=\{([a_j,a_{j+1}],x_j)\}$ de $[a,b]$
on ait
$$
\hbox{$D$ $\delta$-fine}~~
\Rightarrow~~ |S_D(f)-A|\le\varepsilon.
$$
$($une telle jauge $\delta$ sera dite $\varepsilon$-adaptée à $f)$.
Le nombre réel $A$ de la définition 
précédente  est appelé intégrale de $f$ sur $[a,b]$, on écrit
$$
\boxed{19}{
\int_a^b f(x)\,dx = \lim_{\HK,\;D} S_D(f)= \lim_{\HK,\;D} 
\sum_{j=0}^{N-1}f(x_j)(a_{j+1}-a_j)}
$$
et on dit que $\smash{\int_a^b f(x)\,dx}$ est la limite $($au sens de 
Henstock-Kurzweil$\,)$ des sommes de Riemann, lorsque la subdivision $D$ 
devient de plus en plus fine\note{4}{L'intégrale de 
Henstock-Kurzweil est  parfois appelée aussi {\it intégrale de jauge}
ou encore {\it intégrale de Riemann généralisée}. Elle a été
introduite au milieu des années 1950, alors que
l'intégrale de Riemann remonte au 19ème siècle. Bien 
qu'en apparence la définition de Henstock-Kurzweil diffère très peu de
celle de l'intégrale de Riemann, il se trouve qu'elle
jouit de propriétés beaucoup meilleures, tout en procurant des
démonstrations souvent plus simples et en éliminant beaucoup
d'hypothèses superflues, par exemple le fait que $f$ soit 
nécessairement bornée.}.}
\medskip

Cette définition est de façon évidente plus générale que celle 
de Riemann, par
conséquent toute focntion intégrable au sens de Riemann est aussi
intégrable au sens de Henstock-Kurzweil. D'autre part, si une jauge
$\delta$ est $\varepsilon$-adaptée, alors toute jauge $\delta_*\le
\delta$ est encore $\varepsilon$-adaptée.  Nous utiliserons cette
observation à plusieurs reprises dans la section suivante.  La
notation $dx$ intervient pour rappeler qu'à la limite on considère
des rectangles «\?infiniment\?» fins de largeur
$dx=a_{j+1}-a_j$, considérée comme accroissement infiniment petit
de la variable~$x$ (voir Fig.~6 ci-après), et l'écriture
symbolique $\smash{\int_a^bf(x)\,dx}$ se lit «\?somme de
$a$~à~$b$ de $f(x)\,dx$.\?».

\InsertFig 10.000 58.000 {
1 mm unit
   18.000  30.000 moveto  18.000  24.000 lineto 
[  18.000  24.000   25.000  14.000   43.000  49.000   60.000  16.000  
   75.000  40.000   80.000  40.000  ] curve
   80.000  30.000 lineto closepath 
  0.900 setgray fill
 38.000  46.200 moveto  38.000  30.000 lineto
 39.500  30.000 lineto  39.500  46.200 lineto 
gsave
  closepath
  0.7 setgray fill
grestore
  closepath
  0.0 setgray stroke
  0.200 setlinewidth
   18.000  24.000 moveto
[  18.000  24.000   25.000  14.000   43.000  49.000   60.000  16.000  
   75.000  40.000   80.000  40.000  ] curve
 stroke
  0.000 setgray stroke
  0.113 setlinewidth
  5.000  30.000 moveto  97.000   0.000 2.4 vector 
 10.000  10.000 moveto  43.000  90.000 2.4 vector
/arrowlgth 1.2 def
 36.500  25.500 moveto   3.500  68.000 2.4 vector
 41.000  25.500 moveto   3.500 112.000 2.4 vector
 33.200  38.000 moveto   6.000   0.000 2.4 vector
  0.3 setlinewidth
 10.000  46.200 moveto   0.700  90.000 indent 
 18.000  30.000 moveto   0.700   0.000 indent 
 38.000  30.000 moveto   0.700   0.000 indent 
 39.500  30.000 moveto   0.700   0.000 indent 
 80.000  30.000 moveto   0.700   0.000 indent 
  0.113 setlinewidth
[   1.000   0.500 ] 0 setdash 
 18.000  28.500 moveto  18.000  24.000 lineto stroke
 80.000  31.500 moveto  80.000  40.000 lineto stroke
 11.500  46.200 moveto  38.000  46.200 lineto stroke
}
\LabelTeX   15.300  27.000 $a$\ELTX
\LabelTeX   79.300  26.000 $b$\ELTX
\LabelTeX   35.000  23.200 $x$\ELTX
\LabelTeX   40.000  23.200 $x{+}dx$\ELTX
\LabelTeX  100.500  26.200 $x$\ELTX
\LabelTeX    6.200  52.000 $y$\ELTX
\LabelTeX    1.800  45.300 $f(x)$\ELTX
\LabelTeX   21.000  37.000 $f(x)\,dx$\ELTX
\LabelTeX   23.000  22.000 $(-)$\ELTX
\LabelTeX   42.000  40.000 $(+)$\ELTX
\LabelTeX   57.000  22.000 $(-)$\ELTX
\LabelTeX   72.500  34.000 $(+)$\ELTX
\EndFig
\vskip-20pt
\centerline{{\bf Fig.~6.} Intégrale et son élément différentiel 
$f(x)\,dx$.}
\bigskip

{\bf (2.8) Exemple.} On appelle fonction en escalier sur $[a,b]$ une
fonction $f$ telle qu'il existe des points $(u_i)_{0\le i\le p}$ de $[a,b]$
et des constantes réelles $c_i$ telles que 
$$
a=u_0<u_1<\ldots<u_p=b\quad\hbox{et}\quad
f(x)=c_i~~\hbox{sur}~]u_i,u_{i+1}[\,,
$$
les valeurs $f(u_i)\in\bR$ étant elles-mêmes 
quelconques, éventuellement différentes des valeurs $c_i$. 

\vbox{%
\InsertFig  8.000 56.000 {
/arcg { currentpoint currentpoint newpath
        5 -1 roll -90 90 arc stroke moveto } def
/arcd { currentpoint currentpoint newpath
        5 -1 roll  90 270 arc stroke moveto } def
/riem {/y exch 10.0 add def /a2 exch def /a1 exch def
   a1 10.000 moveto  a1 y lineto  a2 y lineto  a2 10.000 lineto } def
1 mm unit
  0.900  0.900  1.000 setrgbcolor
 66.000 80.000 30.000 riem fill
  0.000 setgray
  0.113 setlinewidth
  5.000  10.000 moveto 
107.000   0.000 2.4 vector 
 10.000   0.000 moveto 
 50.000  90.000 2.4 vector 
 stroke
  0.113 setlinewidth
  0.000 setgray
  0.300 setlinewidth
 18.000  24.000 moveto   0.700  arcg
 18.700  24.000 moveto  34.300  24.000 lineto stroke
 35.000  24.000 moveto   0.700  arcd
 35.000  43.000 moveto   0.700  arcg
 35.700  43.000 moveto  46.300  43.000 lineto stroke
 47.000  43.000 moveto   0.700  arcd
 47.000  31.000 moveto   0.700  arcg
 47.700  31.000 moveto  65.300  31.000 lineto stroke
 66.000  31.000 moveto   0.700  arcd
 66.000  40.000 moveto   0.700  arcg
 66.700  40.000 moveto  79.300  40.000 lineto stroke
 80.000  40.000 moveto   0.700  arcd
 80.700  26.000 moveto  89.300  26.000 lineto stroke
 90.000  26.000 moveto   0.700  arcd
  0.250 setlinewidth
 18.000  10.000 moveto   0.700   0.000 indent 
 35.000  10.000 moveto   0.700   0.000 indent 
 47.000  10.000 moveto   0.700   0.000 indent 
 66.000  10.000 moveto   0.700   0.000 indent 
 80.000  10.000 moveto   0.700   0.000 indent 
 90.000  10.000 moveto   0.700   0.000 indent 
 10.000  37.000 moveto   0.700  90.000 indent 
 10.000  40.000 moveto   0.700  90.000 indent 
 18.000  17.000 moveto   0.700  disk
 35.000  34.000 moveto   0.700  disk
 47.000   3.000 moveto   0.700  disk
 66.000  37.000 moveto   0.700  disk
 80.000  26.000 moveto   0.700  disk
 90.000  20.000 moveto   0.700  disk
  0.000   0.000  1.000 setrgbcolor
  0.113 setlinewidth
  0.000 setgray
[   1.000   0.500 ] 0 setdash 
 18.000  11.200 moveto  18.000  17.000 lineto stroke
 35.000  11.200 moveto  35.000  34.000 lineto stroke
 47.000   8.800 moveto  47.000   3.000 lineto stroke
 66.000  11.200 moveto  66.000  36.200 lineto stroke
 80.000  11.200 moveto  80.000  26.000 lineto stroke
 90.000  11.200 moveto  90.000  20.000 lineto stroke
}
\LabelTeX   16.700   6.500 $a$\ELTX
\LabelTeX   34.000   6.500 $u_1$\ELTX
\LabelTeX   65.000   6.500 $\RGBColor{0 0 1}{u_i}$\ELTX
\LabelTeX   78.000   6.500 $\RGBColor{0 0 1}{u_{i+1}}$\ELTX
\LabelTeX   89.300   6.500 $b$\ELTX
\LabelTeX  110.500   6.500 $x$\ELTX
\LabelTeX    6.200  48.000 $y$\ELTX
\LabelTeX   72.000  42.500 $f$\ELTX
\LabelTeX    0.500  36.200 $\RGBColor{0 0 1}{f(u_i)}$\ELTX
\LabelTeX    6.000  40.000 $\RGBColor{0 0 1}{c_i}$\ELTX
\EndFig
\medskip
\centerline{{\bf Fig.~7.} Une fonction en escalier.}}
\medskip

Nous affirmons~:

{\it Toute fonction en escalier $f$ est intégrable au sens de Riemann, 
et on a
$$
\boxed{16}{
\int_a^bf(x)\,dx=\sum_{i=0}^{p-1} c_i(u_{i+1}-u_i).}
$$}

{\it Démonstration.${}^*$} La fonction $f$ est bornée, la 
borne supérieure de $|f|$ est donnée par 
$$
M=\sup_{[a,b]}|f|=\max_{[a,b]}|f|=\max\{|c_i|,\,|f(u_j)|\}.
$$

\InsertFig  8.000 54.000 {
/arcg { currentpoint currentpoint newpath
        5 -1 roll -90 90 arc stroke moveto } def
/arcd { currentpoint currentpoint newpath
        5 -1 roll  90 270 arc stroke moveto } def
/riem {/y exch 10.0 add def /a2 exch def /a1 exch def
   a1 10.000 moveto  a1 y lineto  a2 y lineto  a2 10.000 lineto } def
/hatchedbox {/z exch 10.0 add def  /y exch 10.0 add def 
      /a2 exch def /a1 exch def
   a1 y moveto  a1 z lineto  a2 z lineto  a2 y lineto stroke
   y 1 z { /k exch def a1 k moveto  a2 k lineto stroke } for
} def
1 mm unit
  1.000   0.900   0.900 setrgbcolor
 18.000  21.000   7.000 riem fill
  1.000   0.800   1.000 setrgbcolor
 21.000  27.000  14.000 riem fill
  1.000   0.900   0.900 setrgbcolor
 27.000  31.000  14.000 riem fill
  1.000   0.800   1.000 setrgbcolor
 31.000  33.000  14.000 riem fill
  1.000   0.900   0.900 setrgbcolor
 33.000  37.000  14.000 riem fill
  1.000   0.800   1.000 setrgbcolor
 37.000  40.000  33.000 riem fill
  1.000   0.900   0.900 setrgbcolor
 40.000  45.000  33.000 riem fill
  1.000   0.800   1.000 setrgbcolor
 45.000  49.000  -7.000 riem fill
  1.000   0.900   0.900 setrgbcolor
 49.000  52.000  21.000 riem fill
  1.000   0.800   1.000 setrgbcolor
 52.000  57.000  21.000 riem fill
  1.000   0.900   0.900 setrgbcolor
 57.000  60.000  21.000 riem fill
  1.000   0.800   1.000 setrgbcolor
 60.000  64.000  21.000 riem fill
  1.000   0.900   0.900 setrgbcolor
 64.000  66.000  27.000 riem fill
  1.000   0.800   1.000 setrgbcolor
 66.000  69.000  27.000 riem fill
  1.000   0.900   0.900 setrgbcolor
 69.000  72.000  30.000 riem fill
  1.000   0.800   1.000 setrgbcolor
 72.000  77.000  30.000 riem fill
  1.000   0.900   0.900 setrgbcolor
 77.000  82.000  30.000 riem fill
  1.000   0.800   1.000 setrgbcolor
 82.000  85.000  16.000 riem fill
  1.000   0.900   0.900 setrgbcolor
 85.000  88.000  16.000 riem fill
  1.000   0.800   1.000 setrgbcolor
 88.000  90.000  10.000 riem fill
  0.000   1.000   1.000 setrgbcolor
 18.000  21.000   7.000 14.000 hatchedbox
 35.000  37.000  14.000 33.000 hatchedbox
 45.000  49.000  -7.000 21.000 hatchedbox
 45.000  47.000  21.000 33.000 hatchedbox
 64.000  66.000  21.000 27.000 hatchedbox 
 66.000  69.000  27.000 30.000 hatchedbox 
 80.000  82.000  16.000 30.000 hatchedbox
 88.000  90.000  10.000 16.000 hatchedbox
  0.000 setgray
  0.113 setlinewidth
  5.000  10.000 moveto 
107.000   0.000 2.4 vector 
 10.000   0.000 moveto 
 50.000  90.000 2.4 vector 
 stroke
  0.400 setlinewidth
  1.000   0.000   0.000 setrgbcolor
 21.000  10.000 moveto   0.400   0.000 indent
 27.000  10.000 moveto   0.400   0.000 indent
 31.000  10.000 moveto   0.400   0.000 indent
 33.000  10.000 moveto   0.400   0.000 indent
 37.000  10.000 moveto   0.400   0.000 indent
 40.000  10.000 moveto   0.400   0.000 indent
 45.000  10.000 moveto   0.700   0.000 indent
 49.000  10.000 moveto   0.700   0.000 indent
 52.000  10.000 moveto   0.400   0.000 indent
 57.000  10.000 moveto   0.400   0.000 indent
 60.000  10.000 moveto   0.400   0.000 indent
 64.000  10.000 moveto   0.400   0.000 indent
 66.000  10.000 moveto   0.400   0.000 indent
 69.000  10.000 moveto   0.400   0.000 indent
 72.000  10.000 moveto   0.400   0.000 indent 
 77.000  10.000 moveto   0.400   0.000 indent
 82.000  10.000 moveto   0.400   0.000 indent
 85.000  10.000 moveto   0.400   0.000 indent 
 88.000  10.000 moveto   0.400   0.000 indent
 64.000  48.000 moveto   0.400   0.000 indent 
 66.000  48.000 moveto   0.400   0.000 indent 
 69.000  48.000 moveto   0.400   0.000 indent 
 77.000  48.000 moveto   0.400   0.000 indent 
 82.000  48.000 moveto   0.400   0.000 indent 
  0.113 setlinewidth
 64.000  48.000 moveto  69.000  48.000 lineto stroke
 77.000  48.000 moveto  82.000  48.000 lineto stroke
  0.000 setgray
  0.300 setlinewidth
 18.000  24.000 moveto   0.700  arcg
 18.700  24.000 moveto  34.300  24.000 lineto stroke
 35.000  24.000 moveto   0.700  arcd
 35.000  43.000 moveto   0.700  arcg
 35.700  43.000 moveto  46.300  43.000 lineto stroke
 47.000  43.000 moveto   0.700  arcd
 47.000  31.000 moveto   0.700  arcg
 47.700  31.000 moveto  65.300  31.000 lineto stroke
 66.000  31.000 moveto   0.700  arcd
 66.000  40.000 moveto   0.700  arcg
 66.700  40.000 moveto  79.300  40.000 lineto stroke
 80.000  40.000 moveto   0.700  arcd
 80.700  26.000 moveto  89.300  26.000 lineto stroke
 90.000  26.000 moveto   0.700  arcd
  0.250 setlinewidth
 18.000  10.000 moveto   0.700   0.000 indent 
 35.000  10.000 moveto   0.700   0.000 indent 
 47.000  10.000 moveto   0.700   0.000 indent 
 66.000  10.000 moveto   0.700   0.000 indent 
 80.000  10.000 moveto   0.700   0.000 indent 
 90.000  10.000 moveto   0.700   0.000 indent 
 10.000  40.000 moveto   0.700  90.000 indent 
 18.000  17.000 moveto   0.700  disk
 35.000  34.000 moveto   0.700  disk
 47.000   3.000 moveto   0.700  disk
 66.000  37.000 moveto   0.700  disk
 80.000  26.000 moveto   0.700  disk
 90.000  20.000 moveto   0.700  disk
  0.000   0.000  1.000 setrgbcolor
 23.000  10.000 moveto   0.700   0.000 indent
 23.000  24.000 moveto   0.700   0.000 indent
 33.700  10.000 moveto   0.700   0.000 indent
 33.700  24.000 moveto   0.700   0.000 indent
 78.500  10.000 moveto   0.700   0.000 indent
 78.500  40.000 moveto   0.700   0.000 indent
 10.000  24.000 moveto   0.700  90.000 indent
  0.113 setlinewidth
  0.000 setgray
[   1.000   0.500 ] 0 setdash 
 18.000  11.200 moveto  18.000  17.000 lineto stroke
 35.000  11.200 moveto  35.000  34.000 lineto stroke
 47.000   8.800 moveto  47.000   3.000 lineto stroke
 66.000  11.200 moveto  66.000  36.200 lineto stroke
 80.000  11.200 moveto  80.000  26.000 lineto stroke
 90.000  11.200 moveto  90.000  20.000 lineto stroke
 45.000  48.000 moveto  49.000  48.000 lineto stroke
 45.000  48.000 moveto   0.000   0.000 2.4 vector
 49.000  48.000 moveto   0.000 180.000 2.4 vector
100.000   3.000 moveto 100.000  43.000 lineto stroke
100.000   3.000 moveto   0.000  90.000 2.4 vector
100.000  43.000 moveto   0.000 270.000 2.4 vector
}
\LabelTeX   16.700   6.500 $a$\ELTX
\LabelTeX   19.200   6.500 $\RGBColor{1 0 0}{a_1}$\ELTX
\LabelTeX   22.300   6.500 $\RGBColor{0 0 1}{x_1}$\ELTX
\LabelTeX   26.300   6.500 $\RGBColor{1 0 0}{a_2}$\ELTX
\LabelTeX   41.400   6.500 $\RGBColor{1 0 0}{a_j}$\ELTX
\LabelTeX   49.500   6.500 $\RGBColor{1 0 0}{a_{j+1}}$\ELTX
\LabelTeX   34.000   6.500 $u_1$\ELTX
\LabelTeX   65.000   6.500 $u_i$\ELTX
\LabelTeX   78.000   6.500 $u_{i+1}$\ELTX
\LabelTeX   89.300   6.500 $b$\ELTX
\LabelTeX  110.500   6.500 $x$\ELTX
\LabelTeX    6.200  48.000 $y$\ELTX
\LabelTeX   72.000  42.500 $f$\ELTX
\LabelTeX    6.000  39.700 $c_i$\ELTX
\LabelTeX    0.000  23.000 $\RGBColor{0 0 1}{f(x_1)}$\ELTX
\LabelTeX   45.500  50.000 $h_j$\ELTX
\LabelTeX  101.000  30.000 $\le 2M$\ELTX
\LabelTeX   63.500  50.000 $\RGBColor{1 0 0}{2\,\hbox{int}}$\ELTX
\LabelTeX   76.500  50.000 $\RGBColor{1 0 0}{1\,\hbox{int}}$\ELTX
\EndFig
\medskip
\centerline{{\bf Fig.~8.} Sommes de Riemann d'une fonction en escalier.}
\medskip

Soit $D=\{([a_j,a_{j+1}],x_j)\}$ une subdivision $\delta$-fine pour
une certaine constante~$\delta>0$ (les~points $a_j$ n'ont a priori aucun
rapport avec les points de subdivision $u_i$ de la fonction en escalier).
La somme de Riemann $S_D(f)=\sum
f(x_j)h_j$ est représentée par par la somme des aires des rectangles
de couleur rosée de la Fig.~8 (avec les points $a_j$ en rouge et les
points de marquage $x_j$ en bleu -- tous ceux-ci n'étant pas
représentés). La différence entre les aires $S_D(f)$ et $\sum
c_i(u_{i+1}-u_i)$ (partie en noir du graphe) est représentée par les
zones hachurées en bleu clair.
Nous avons au plus $2p$ intervalles $[a_j,a_{j+1}]$ qui 
contiennent l'un des points inter\-médiaires $u_i$, à savoir un à 
chaque extrêmité et un ou deux pour chacun des points $u_i$,
$i=1,\ldots,p-1$. Pour chacun de ces intervalles, le terme $f(x_j)h_j$ 
mis en jeu diffère de l'aire des deux rectangles délimités par
le graphe de $f$ par au plus $2Mh_j\le2M\delta$, puisque
$|f(x)-f(x_j)|\le 2M$ et $h_j\le\delta$. Au total on a donc
$$
\Big|S_D(f)-\sum_{0\le i\le p-1} c_i(u_{i+1}-u_i)\Big|\le 
2p\times 2M\delta=4pM\delta.
$$
Il suffit alors de choisir $\delta=\varepsilon/(4pM)$ pour
conclure.\qed
\bigskip

\section{3. Propriétés élémentaires de l'intégrale}

Les propriétés énoncées dans cette section sont, dans l'ordre,
la linéarité, la monotonie et la relation de Chasles. 
Elles sont obtenues par passage à la limite à partir 
des propriétés analogues des sommes de Riemann $S_D(f)$
(propriétés 1.4 (a,b,c)), et valent
pour l'intégrabilité au sens de Riemann et de Henstock-Kurzweil
indifféremment.
\medskip

{\bf (3.1) Linéarité.} {\it Si $f,g:[a,b]\to\bR$ sont des fonctions 
intégrables sur $[a,b]$ et $\lambda$,~$\mu$ des constantes réelles, 
alors $\lambda f+\mu g$ est intégrable sur $[a,b]$ et
$$
\boxed{16}{
\int_a^b \big(\lambda f(x)+\mu g(x)\big)\,dx
=\lambda\int_a^b f(x)\,dx+\mu\int_a^b g(x)\,dx.}
$$}

{\it Démonstration.} En termes de limites de sommes de Riemann sur des 
subdivisions pointées $D$ de $[a,b]$, nous pouvons écrire
$$
\eqalignno{
\int_a^b \big(\lambda f(x)+\mu g(x)\big)\,dx
&=\lim_{\HK,\;D} S_D(\lambda f+\mu g)
= \lim_{\HK,\;D} \lambda S_D(f)+\mu S_D(g)\cr
&=\lambda\lim_{\HK,\;D} S_D(f)+\mu \lim_{\HK,\;D} S_D(g)\cr
&=\lambda\int_a^b f(x)\,dx+\mu\int_a^b g(x)\,dx.&\square\cr}
$$
Pour analyser plus en détail cet argument, reprenons le calcul en termes de 
jauges, une marge d'erreur $\varepsilon>0$ étant fixée a priori. Posons
$$
A=\int_a^b f(x)\,dx,\qquad B=\int_a^b g(x)\,dx.
$$
Il existe par hypothèse des jauges 
$\delta_1$, $\delta_2$ telles que si $D$ est $\delta_1$-fine alors
$|S_D(f)-A|\le\varepsilon$ et si $D$ est $\delta_2$-fine alors
$|S_D(g)-B|\le\varepsilon$. Prenons une subdivision $D$ $\delta$-fine
avec $\delta=\min(\delta_1,\delta_2)$. Comme 
$S_D(\lambda f+\mu g)=\lambda S_D(f)+\mu S_D(g)$ on en déduit
$$
\big|S_D(\lambda f+\mu g)-(\lambda A+\mu B)\big|\le 
(|\lambda|+|\mu|)\varepsilon.
$$
Ceci montre que $\lambda f+\mu g$ est intégrable et que son 
intégrale est bien $\lambda A+\mu B$.
\medskip

{\bf (3.2) Remarque.} Si $f:[a,b]\to\bR$ est une fonction qui est
nulle partout sauf en un nombre fini de points $u_i\in[a,b]$, alors
$f$ est Riemann-intégrable d'intégrale nulle\note{5}{Pour
l'intégrabilité au sens de Henstock-Kurzweil, ce résultat est
vrai plus généralement dans le cas où $f$ est nulle partout en
dehors d'un ensemble dénombrable de points $E\subset[a,b]$. Voir
l'exercice 9.22.}.  C'est en effet un cas très particulier de
fonction en escalier, et on peut appliquer la formule de l'exemple 2.8 avec
$c_i=0$. Il en résulte que si deux fonctions $g,\,h:[a,b]\to\bR$
diffèrent en un nombre fini de points, alors l'intégrabilité de
l'une équivaut à l'intégrabilité de l'autre et on a
$\smash{\int_a^bg(x)\,dx= \int_a^bh(x)\,dx}$ (puisque $f=g-h$ est
d'intégrale nulle).\qed \medskip

{\bf (3.3) Monotonie.} {\it Si $f,g:[a,b]\to\bR$ sont des fonctions 
intégrables sur $[a,b]$
$$
\boxed{16}{
f\ge g\quad \Rightarrow\quad\int_a^b f(x)\,dx\ge \int_a^b g(x)\,dx.}
$$}%
{\it Démonstration.}
Cela résulte de l'inégalité sur les sommes de Riemann
$S_D(f)\ge S_D(g)$, par passage à la limite.\qed
\bigskip

\vbox{%
{\bf (3.4) Relation de Chasles.} {\it Soient $a<b<c$ des réels et
$f:[a,c]\to\bR$ une fonction. Si $f$ est intégrable sur $[a,b]$ et 
intégrable sur $[b,c]$, alors $f$ est intégrable sur $[a,c]$ et 
$$
\boxed{16}{
\int_a^c f(x)\,dx=\int_a^b f(x)\,dx+\int_b^c f(x)\,dx.}
$$
Ceci vaut aussi bien pour l'intégrabilité au sens de Henstock-Kurzweil
que pour l'inté\-grabilité au sens de Riemann.}}

{\it Démonstration.} Fixons un réel $\varepsilon>0$ et 
choisissons des jauges
$\delta_1:[a,b]\to\bR^*_+$, $\delta_2:[b,c]\to\bR^*_+$ 
$\varepsilon$-adaptées à $f$ sur $[a,b]$ et $[b,c]$ respectivement.
Autrement dit, si on écrit
$$
A_1=\int_a^b f(x)\,dx,\qquad A_2=\int_b^c f(x)\,dx,\qquad A=A_1+A_2,
$$
on aura $|S_{D_1}(f)-A_1|\le\varepsilon$ et $|S_{D_2}(f)-A_2|\le\varepsilon$
pour toutes subdivisions pointées
$\delta_1$-fines $D_1$ de $[a,b]$ et $\delta_2$-fines $D_2$ de
$[b,c]$. Si nous supposons démontrée l'intégrabilité de $f$ sur
$[a,c]$, c'est-à-dire l'existence de la limite
$\lim_{\HK,\,D}S_D(f)$ lorsque $D$ parcourt les subdivisions pointées
de $[a,c]$, alors on peut prendre une jauge $\delta$ sur $[a,c]$ telle
que $\delta\le\delta_1$ sur $[a,b]$ et $\delta\le\delta_2$ sur $[b,c]$,
et une subdivision $D=D_1\cup D_2$ $\delta$-fine égale à la
réunion d'une subdivision $D_1$ $\delta_1$-fine de $[a,b]$ et d'une
subdivision $D_2$ $\delta_2$-fine de $[b,c]$. On obtient dans ces
conditions $S_D(f)=S_{D_1}(f)+S_{D_2}(f)$, donc $|S_D(f)-A|\le
2\varepsilon$ et la relation désirée
$$
\int_a^c f(x)\,dx =\lim_{\HK,\;D}S_D(f)=
A=A_1+A_2=\int_a^b f(x)\,dx+\int_b^c f(x)\,dx
$$
s'ensuit en prenant $\varepsilon$ arbitrairement petit. La seule 
difficulté qui reste est de démontrer
l'existence de la limite $\lim_{\HK,\,D}S_D(f)$ pour des subdivisions
$D=\{([a_j,a_{j+1}],x_j)\}$ de $[a,c]$
ne comprenant pas nécessairement $a_j=b$ comme l'un des points
intermédiaires, ce qui est a priori requis pour prouver
l'intégrabilité de $f$ sur $[a,c]$. La méthode consiste à 
redécouper l'intervalle $[a_j,a_{j+1}]$ de $D$ qui contient le point~$b$,
et à estimer de combien on modifie ainsi la somme de Riemann~$S_D(f)$.
\medskip

{\bf (3.5)* Preuve de l'intégrabilité de $f$ sur $[a,c]$ sous
les hypothèses de 3.4.}\break
Dans le cas de l'intégrabilité au sens de Henstock-Kurzweil, la preuve
est très simple. On définit une jauge $\delta$ sur $[a,c]$ en posant
$$
\delta(x)=\cases{
\min(\delta_1(x),(b-x)/2)&si $x\in[a,b[$,\cr
\min(\delta_2(x),(x-b)/2)&si $x\in{}]b,c]$,\cr
\min(\delta_1(b),\delta_2(b))& si $x=b$.\cr
}
$$
de sorte que $\delta\le\delta_1$ sur $[a,b]$ et $\delta\le\delta_2$
sur $[b,c]$. Soit $D=\{([a_j,a_{j+1}],x_j)\}$ une subdivision $\delta$-fine.
Si $x_j<b$, alors on a
\hbox{$a_{j+1}\le x_j+\delta(x_j)<x_j+(b-x_j)=b$}.
De même, si
$x_j>b$, alors \hbox{$a_j\ge x_j-\delta(x_j)>x_j-(x_j-b)=b$}. Ceci 
montre que le
seul cas où $[a_j,a_{j+1}]$ peut contenir le point $b$ est le cas
$x_j=b$, ce qui permet de découper l'intervalle pointé $([a_j,a_{j+1}],b)$
en les deux intervalles pointés $([a_j,b],b)$ et
$([b,a_{j+1}],b)$. On produit ainsi une subdivision pointée
$D_1$ $\delta_1$-fine de $[a,b]$ et une subdivision  pointée
$D_2$ $\delta_2$-fine de $[b,c]$ telles que $S_D(f)=S_{D_1}(f)+S_{D_2}(f)$.
On a donc $|S_D(f)-A|\le 2\varepsilon$ et la conclusion s'ensuit
comme précédemment.\qed

Dans le cas de l'intégrabilité au sens de Riemann, la preuve donnée 
ci-dessus n'est pas valable, car la jauge $\delta$ produite n'est pas 
constante. On sait cependant de plus que $f$ est bornée, disons $|f|\le M$ 
(si $f$ est Riemann-intégrable sur $[a,b]$ et $[b,c]$, elle y est 
nécessai\-rement bornée d'après la condition 2.4).
Prenons pour $D$ une subdivision pointée $\delta$-fine avec $\delta\le
\min(\delta_1,\delta_2)$.  Si l'un des intervalles $[a_j,a_{j+1}]$
contient $b$ en son intérieur, on remplace son point de marquage
$x_j$ par $x'_j=b$, ce qui donne après découpage comme ci-dessus
une nouvelle subdivision $D'=D_1\cup D_2$ $\delta$-fine telle que
$$
S_{D'}(f)=S_{D_1}(f)+S_{D_2}(f)~~\Rightarrow~~
\big|S_{D'}(f)-A\big|\le2\varepsilon.
$$
On a de plus
$$
\big|S_D(f)-S_{D'}(f)\big|=\big|\big(f(x_j)-f(b)\big)h_j\big|\le 2M\delta,
$$
par conséquent $\big|S_D(f)-A\big|\le 4\varepsilon$
dès que $\delta\le\min(\delta_1,\delta_2,\varepsilon/M)$. Ceci entraîne
bien l'intégrabilité de $f$ au sens de Riemann sur l'intervalle 
$[a,c]$, ainsi que la formule de Chasles\note{6}{%
On peut donner une démonstration alternative un peu plus subtile,
valable à la fois pour 
l'intégrabilité au sens de Henstock-Kurzweil et pour l'intégrabilité
au sens de Riemann. Pour cela, on~fixe un réel positif $\theta$
assez petit et, avec les notations ci-dessus, on définit une jauge
$\delta$ sur $[a,c]$ en posant\smallskip
\centerline{$\dsp
\delta(x)=\cases{
\min(\delta_1(x),\theta)&si $x\in[a,b[$,\cr
\min(\delta_2(x),\theta)&si $x\in{}]b,c]$,\cr
\theta& si $x=b$,\cr
}$}
de sorte que $\delta\le\delta_1$ sur $[a,b]$, $\delta\le\delta_2$
sur $[b,c]$ et $\delta(x)\le\theta$ sur $[a,c]$
(la valeur précise de $\theta$ sera attribuée plus loin.)
La~difficulté qui se pose est d'étudier ce qui se passe au point de 
jonction~$x=b$. Ceci fait l'objet du lemme suivant.\vskip-2pt
{\bf Lemme.} {\it Supposons $\theta$ choisi tel que 
$\theta\le\min(\delta_1(b),b-a)$.
Si $x\in[a,b]$ est tel que $|x-b|\le\delta(x)$, alors
$|f(x)-f(b)|\,\delta(x)\le 2\varepsilon$.}\vskip-2pt
En effet, choisissons grâce au lemme 2.6 une subdivision pointée
$\delta_1$-fine $D_*$ de l'inter\-valle $[a,b-\delta(x)]$ 
(notons que $b-\delta(x)\ge b-\theta\ge a$).
On pose $D_1=D_*\cup\{([b-\delta(x),b],x)\}$ et
$D_1'=D_*\cup\{([b-\delta(x),b],b)\}$. Ce sont bien des 
subdivisions pointées $\delta_1$-fines de $[a,b]$ du fait que
$\delta(x)\le\delta_1(x)$ et $\delta(x)\le\theta\le\delta_1(b)$.
Or $S_{D_1}(f)-S_{D_1'}(f)=(f(x)-f(b))\delta(x)$ par définition des
sommes de Riemann. Comme $|S_{D_1}(f)-A_1|\le\varepsilon$ et
$|S_{D_1'}(f)-A_1|\le\varepsilon$, le lemme s'ensuit
par différence.\qed\vskip-2pt
Notons que par un raisonnement symétrique sur $[b,c]$, le lemme est 
également valable pour $x\in[b,c]$ si
on suppose $\theta\le\min(\delta_2(b),c-b)$. On choisira donc\smallskip
\centerline{$\theta=\min(\delta_1(b),\delta_2(b),b-a,c-b).$}\vskip-2pt
Considérons maintenant une subdivision pointée 
$\delta$-fine $D=\{([a_j,a_{j+1}],x_j)\}$ de $[a,c]$.
Si $D$ contient $a_j=b$ comme point intermédiaire, 
$D$ induit une subdivision $\delta_1$-fine $D_1$ de $[a,b]$ et 
une subdivision $\delta_2$-fine $D_2$ de $[b,c]$ telles que
\hbox{$S_D(f)=S_{D_1}(f)+S_{D_2}(f)\,$}; puisque
$|S_{D_i}(f)-A_i|\le\varepsilon$, $i=1,2$, on voit alors que
$|S_D(f)-A|\le 2\varepsilon$. Sinon, l'un des intervalles
$[a_j,a_{j+1}]$ contient le point $b$ en son intérieur, et comme
$h_j=a_{j+1}-a_j\le\delta(x_j)\le\theta=\delta(b)$, on peut remplacer
$([a_j,a_{j+1}],x_j)$ par l'intervalle pointé $([a_j,a_{j+1}],b)$. Ceci donne
une nouvelle subdivision $\delta$-fine $D'$ de $[a,c]$ telle que\smallskip
\centerline{$%
|S_D(f)-S_{D'}(f)|=|f(x_j)-f(b)|\,(a_{j+1}-a_j)\le
|f(x_j)-f(b)|\,\delta(x_j)\le 2\varepsilon$}\vskip-2pt
d'après le lemme. En décomposant $([a_j,a_{j+1}],b)$ en les
deux intervalles pointés $([a_j,b],b)$ et\break $([b,a_{j+1}],b)$,
on obtient maintenant une subdivision $\delta_1$-fine $D_1'$ 
de $[a,b]$ et une subdivision $\delta_2$-fine $D_2'$ de $[b,c]$ telles que
$S_{D'}(f)=S_{D_1'}(f)+S_{D_2'}(f)$, et par conséquent
$|S_{D'}(f)-A|\le 2\varepsilon$. Dans le pire des cas nous obtenons
$|S_D(f)-A|\le 4\varepsilon$, d'où $\lim_{\HK,\;D}S_D(f)=A$. Ceci
achève la preuve de l'intégrabilité de $f$ au sens de
Henstock-Kurzweil. Dans le cas de l'intégrabilité 
au sens  de Riemann, on voit d'après ce qui précède
qu'on peut choisir la jauge constante 
$\delta=\min(\delta_1,\delta_2,b-a,c-b)$.}.\qed
\medskip

Pour des réels $a$, $b$ qui ne vérifient pas néces\-sairement $a<b$,
on pose
$$
\int_a^bf(x)\,dx = 0\quad\hbox{si $a=b$},\qquad
\int_a^bf(x)\,dx = -\int_b^af(x)\,dx\quad\hbox{si $a>b$}.
\leqno(3.6)
$$
On peut vérifier que la relation de Chasles reste valable dans tous les
cas, quel que soit l'ordre des réels $a,b,c$, à condition bien sûr 
que $f$ soit intégrable sur chacun des intervalles mis en jeu.
\medskip

Nous souhaitons maintenant étudier l'intégrabilité en restriction à un
sous-intervalle. Pour cela, nous avons besoin du critère 
d'inté\-grabilité de
Cauchy, qui donne une condition nécessaire et suffisante
d'intégrabilité sans qu'il soit nécessaire de faire intervenir la
valeur $A$ de l'intégrale.
\medskip

{\bf (3.7) Critère de Cauchy**}. {\it Soit $f:[a,b]\to\bR$ une fonction
définie sur un intervalle $[a,b]$ fermé borné. Pour que $f$ soit
HK-intégrable $($resp.\ Riemann-intégrable$)$, il faut et il suffit que 
pour tout $\varepsilon>0$ il existe une jauge $\delta:[a,b]\to\bR_+^*$
$($resp.\ une constante $\delta>0)$, telle que
pour toutes subdivisions pointées $D$ et~$D'$ $\delta$-fines on ait
\hbox{$|S_{D'}(f)-S_D(f)|\le\varepsilon$}.  }

{\it Démonstration.} Si $f$ est HK-intégrable d'intégrale $A$,
pour chaque jauge
$\delta$ qui est $\varepsilon/2$-adaptée à $f$, les
inégalités $|S_D(f)-A|\le\varepsilon/2$ et
$|S_{D'}(f)-A|\le\varepsilon/2$ pour $D,\;D'$ $\delta$-fines
entraînent $|S_{D'}(f)-S_D(f)|\le\varepsilon$.  La réciproque
est une conséquence de la complétude de $\bR$ (cf.\ \S$\,$II.1, et
en particulier II.1.6, pour plus de détails).\qed
\medskip

Nous pouvons maintenant énoncer le théorème sur l'intégrabilité des 
restrictions.
\medskip

{\bf (3.8) Théorème**.} {\it Soit $f : [a,b]\to\bR$ une fonction
HK-intégrable $($resp.\ Riemann-intégrable$)$.
Alors la restriction $f_{|[c,d]}$ de $f$ à tout intervalle
$[c,d]\subset [a,b]$ est encore HK-intégrable $($resp.\
Riemann-intégrable$)$.}

{\it Démonstration.} On utilise le critère de Cauchy. Étant donné 
$\varepsilon>0$, il existe une jauge $\delta$ sur $[a,b]$ telle
que $|S_D(f)-S_{D'}(f)|\le\varepsilon$ pour toutes subdivisions pointées
$\delta$-fines $D$ et $D'$ de~$[a,b]$. Soient maintenant $\Delta$ et $\Delta'$
deux subdivisions pointées de $[c,d]$ qui sont $\delta_{|[c,d]}$-fines.
En considérant grâce au lemme 2.6 des subdivisions de $[a,c]$ et de $[d,b]$
qui sont $\delta$-fines, on peut compléter $\Delta$ et $\Delta'$
en des subdivisions pointées $D$ et $D'$ de $[a,b]$ qui sont elles-mêmes
$\delta$-fines. On obtient alors
$$
|S_{\Delta}(f)-S_{\Delta'}(f)|=|S_D(f)-S_{D'}(f)|\le\varepsilon.
$$
Le théorème est démontré. Pour l'intégrabilité au sens de Riemann
la preuve est tout à fait analogue.\qed
\bigskip

\section{4. Le théorème fondamental de l'Analyse}

On appelle théorème fondamental de l'analyse, le fait que
l'intégration (calcul d'aires) et la dérivation (calcul de
tangentes et de différentielles) sont des opérations inverses
l'une de l'autre. 
\medskip

{\bf (4.1) Théorème.} {\it Soit $f:[a,b]\to\bR$ une fonction dérivable. 
Alors $f'$ est inté\-grable au sens de Henstock-Kurzweil et
$$
\boxed{16}{
\int_a^bf'(x)\,dx = f(b)-f(a).}
$$}
\vskip-8pt

{\it Démonstration.}
Commençons par une preuve heuristique (c'est-à-dire simplifiée, mais
non rigoureuse). Soit
$D=\{[a_j,a_{j+1}],x_j)\}$ une subdivision pointée assez fine. On a
par définition
$$
\int_a^bf'(x)\,dx\simeq\sum_{j=0}^{N-1}f'(x_j)(a_{j+1}-a_j).
$$
Mais $f'(x_j)$ peut être vu comme une approximation de la pente
de $f$ sur l'intervalle $[a_j,a_{j+1}]$ et on a donc
$f'(x_j)(a_{j+1}-a_j)\simeq f(a_{j+1})-f(a_j)$, d'où
$$
\int_a^bf'(x)\,dx\simeq\sum_{j=0}^{N-1}(f(a_{j+1})-f(a_j))=f(b)-f(a).
$$
Il n'est pas difficile de rendre cet argument rigoureux.
L'hypothèse de l'exis\-tence de $f'(x)=\lim_{y\to x}
{f(y)-f(x)\over y-x}$ signifie par
définition que pour tout pout $x\in[a,b]$ et tout $\varepsilon>0$
il existe un réel $\delta(x)>0$ tel que
$$
y\in[a,b],\quad
0<|y-x|\le\delta(x)\Rightarrow\Big|{f(y)-f(x)\over y-x}-f'(x)
\Big|\le\varepsilon,\qquad\hbox{et donc}
$$
$$
y\in[a,b],\quad y\in[x-\delta(x),x+\delta(x)]\Rightarrow 
\big|f(y)-f(x)-(y-x)f'(x)\big|\le\varepsilon|y-x|
$$
(puisque l'inégalité est vraie aussi de manière évidente pour $y=x$).
Prenons une sub\-di\-vision pointée $D=\{[a_j,a_{j+1}],x_j)\}$
$\delta$-fine, c'est-à dire telle que \hbox{$h_j=a_{j+1}-a_j\le
\delta(x_j)$}. En appliquant l'égalité ci-dessus à $x=x_j$ et $y=a_j$ ou
$y=a_{j+1}$, il vient
$$
\eqalign{
\big|f(a_j)-f(x_j)-(a_j-x_j)f'(x_j)\big|
&\le \varepsilon|a_j-x_j|=\varepsilon(x_j-a_j),\cr
\big|f(a_{j+1})-f(x_j)-(a_{j+1}-x_j)f'(x_j)\big|
&\le\varepsilon|a_{j+1}-x_j|=\varepsilon(a_{j+1}-x_j).\cr}
$$
En faisant la différence, l'inégalité $|v-u|\le|u|+|v|$ donne
$$
\big|f(a_{j+1})-f(a_j)-(a_{j+1}-a_j)f'(x_j)\big|\le\varepsilon(a_{j+1}-a_j).
$$
La sommation de ces inégalités pour $j=0,1,\ldots, N-1$ implique
en définitive
$$
\big|f(b)-f(a)-S_D(f')\big|\le\varepsilon(b-a),
$$
par conséquent
$$
\int_a^bf'(x)\,dx = \lim_{\HK,\;D}S_D(f')=f(b)-f(a).\eqno\square
$$

Notons qu'on retrouve ainsi le résultat important suivant qui,
alternativement (et de manière plus classique) est démontré au moyen 
du théorème des accroissements finis.
\medskip

{\bf(4.2)  Corollaire.} 
{\it Soit $f$ une fonction dérivable sur un intervalle $I$ de
$\bR$, telle que $f'=0$ $($resp.\ $f'\ge 0$, $f'\le 0)$. Alors $f$ est
constante $($resp.\ croissante, décroissante$)$.}
\medskip

{\it Démonstration.} 
En effet, pour tous points $a<b$ dans $I$, on voit que $f(b)-f(a)$ est
égal à $0$ (resp.\ positif ou nul, négatif ou nul).\qed
\medskip

Le théorème fondamental peut aussi se s'énoncer comme une formule de
calcul d'une intégrale à partir de la primitive d'une fonction.
\medskip

{\bf (4.3) Calcul des intégrales au moyen de primitives.} {\it
Si $f:[a,b]\to\bR$
admet une primitive $F$ $($c'est-à-dire
si $F$ est dérivable et $F'=f)$, alors $f$ est intégrable et
$$
\boxed{16}{
\int_a^b f(x)dx = F(b)-F(a)\qquad\hbox{encore noté}\quad \big[F(x)\big]_a^b.}
$$}

Pour exploiter cette formule\note{7}{On
notera que pour en arriver là, on a eu besoin de nettement moins de 
théorie que dans l'approche classique de l'intégrale de Riemann. En effet,
dans cette approche, on est amené à supposer que $f$ est continue --
ce qui, outre le fait d'amener des hypothèses superflues de continuité,
nécessite de démontrer (ou d'admettre) l'intégrabilité des fonctions continues 
au sens de Riemann. Tous les résultats du paragraphe 5 sont également
affectés, comme la formule d'intégration par parties.}, il convient 
de connaître une liste suffisante de primitives de fonctions usuelles
-- en connaître un certain nombre par cœur devient vite indispensable
pour être en mesure de calculer les intégrales de manière efficace.
Compte tenu de la formule 4.3, la primitive $F$ d'une fonction
continue $f$, là où elle est définie, sera notée sous la forme
$$
F(x)=\int f(x)\,dx + C,\leqno(4.4)
$$
où $C$ désigne une constante quelconque. Une écriture de la
forme $\int f(x)\,dx$ est parfois appelée {\it intégrale indéfinie}. On
sous-entend (contrairement à la notation utilisée pour une intégrale
définie) que la variable $x$ utilisée pour la fonction primitive $F(x)$
est la même que celle utilisée sous le signe~$\int$.
\medskip

{\bf (4.5) Liste de primitives usuelles.} Voici une liste de primitives 
qui permet déjà de calculer un bon
nombre d'intégrales usuelles. Les variables $\alpha$, $a$, $b$ représentent
ici des nombres réels quelconques avec $a\ne 0$.
$$
\cmalign{25pt}{
\int x^\alpha\,dx = {x^{\alpha+1}\over\alpha+1}+C,~\alpha\ne -1
&\int {1\over x} \,dx = \ln|x|+C
\cr
\int \ln|x|\,dx =  x\ln|x| -x+C
&\int e^{ax}\,dx = {1\over a}e^{ax}+C
\cr
\int\cos (ax+b)\,dx = {1\over a}\sin(ax+b) + C
&\int \sin(ax+b)\,dx = -{1\over a}\cos(ax+b) +C
\cr
\int {1\over\cos^2 x}\,dx = \tan x +C
&\int {1\over \sin^2 x}\,dx = -\cotan x + C
\cr
\int {1\over x^2+a^2}\,dx= {1\over a}\arctan{x\over a}+C
&\int {1\over x^2-a^2}\,dx= {1\over 2a}\ln\Big|{x-a\over x+a}\Big|+C
\cr}
$$
Voici une autre liste de fonctions un peu moins élémentaires
$$
\cmalign{12pt}{
\int {x\over \sqrt{a^2-x^2}}\,dx= -\sqrt{a^2-x^2}+C
&\int {1\over \sqrt{a^2-x^2}}\,dx= \arcsin{x\over |a|}+C
\cr
\int {x\over \sqrt{x^2+a^2}}\,dx= \sqrt{x^2+a^2}+C
&\int {1\over \sqrt{x^2+a^2}}\,dx= \ln\big(x+\sqrt{x^2+a^2}\big)+C
\cr
\int {x\over \sqrt{x^2-a^2}}\,dx= \sqrt{x^2-a^2}+C
&\int {1\over \sqrt{x^2-a^2}}\,dx= \ln\big(x+\sqrt{x^2-a^2}\big)+C
\cr
\int {x\over(ax^2+b)^{3/2}}\,dx=
{-1\over a(ax^2+b)^{1/2}}+ C
&\int {1\over(ax^2+b)^{3/2}}\,dx= {x\over b(ax^2+b) ^{1/2}}+ C
\cr
\int \sinh(ax+b)\,dx = {1\over a}\cosh(ax+b) + C
&\int \cosh(ax+b)\,dx = {1\over a}\sinh(ax+b) +C
\cr
\int {1\over\cosh^2 x}\,dx = \tanh x + C
&\int {1\over\sinh^2 x}\,dx = -\cotanh x + C.
\cr}
$$
\medskip

{\bf (4.6) Compléments**.}\smallskip
(a) Si on souhaite énoncer le théorème 4.1 dans
le cadre de la théorie de l'intégrale de Riemann, il convient d'ajouter
l'hypothèse que la fonction dérivée $f'$ soit intégrable au sens de Riemann.
Dans ce cas, on peut aussi invoquer le théorème des accroissements finis
pour démontrer la formule (4.1)~: on sait qu'il existe $c_j\in{}]a_j,
a_{j+1}[$ tel que $f(a_{j+1})-f(a_j)=(a_{j+1}-a_j)f'(c_j)$ et donc
par sommation $f(b)-f(a)=S_D(f')$ pour la subdivision pointée particulière
$D=\{[a_j,a_{j+1}],c_j)\}\,$; ceci montre bien à la limite que
$$
f(b)-f(a)=\int_a^b f'(x)\,dx.
$$

(b) Considérons l'exemple classique de la fonction $f:[0,1]\to\bR$
telle que
$$
f(x)=x^2\,\sin(x^{-n})\quad\hbox{pour $x\ne 0$,~~~et}\quad
f(0)=0.
$$
Il est facile de voir que \hbox{$f'(0)=\lim_{x\to 0} f(x)/x=0$}
et donc que $f$ est partout dérivable sur~$\bR$. Cependant, pour $n\ge 2$,
$f'(x)=2x\,\sin(x^{-n})-nx^{1-n}\cos(x^{-n})$ est non bornée au voisinage
de $0$ 
et donc non intégrable au sens de Riemann sur $[0,1]$.\note{8}{%
En fait, il est facile de voir que $f$ n'est pas non plus intégrable au
sens de Lebesgue sur $[0,1]$ pour $n\ge 2$, puisque les intégrales
$\int_0^1x^{1-n}|\cos(x^{-n})|\,dx$ et $\int_0^1|f'(x)|\,dx$ divergent.
Pour que le théorème (4.1) soit valable en théorie de Lebesgue, il faut
là encore faire l'hypothèse supplémentaire que $f$ soit intégrable
au sens de Lebesgue. C'est donc un résultat particulièrement
impressionnant de la théorie de Henstock-Kurzweil.}


(c) On démontrera plus loin (cf.\ (11.6 b)) qu'il existe une fonction
$f:\bR\to\bR$ partout dérivable telle que $f'$ prend des valeurs
positives, négatives et nulles sur tout intervalle de $\bR$, avec de
plus $|f'|\le 1$. Une telle fonction $f$ n'est intégrable au sens de
Riemann sur aucun intervalle $[a,b]$ de~$\bR$. En effet, si elle
l'était, elle serait également intégrable sur tout sous-intervalle
$[c,d]\subset [a,b]$, et en prenant des points de subdivisions $x_j$
tels que $f'(x_j)>0$ (resp.\ $f'(x_j)<0$), on conclurait à la limite
que $f(d)-f(c)=\smash{\int_c^d}f'(x)\,dx$ est${}\ge 0$ et aussi${}\le
0$, ce qui impliquerait que $f$ est constante sur $[a,b]$, en
contradiction avec l'hypothèse sur la variation du signe de $f'$ sur
tout intervalle.\note{9}{On peut démontrer aussi qu'il existe une
  fonction $f:\bR\to\bR$ continue et dérivable presque partout, telle que
  $f'$ ne soit intégrable au sens de Lebesgue sur aucun intervalle de
  $\bR$, cf.\ Proposition (11.8). Ces «\?défauts\?» de la théorie de
  Lebesgue avaient amené
  A.~Denjoy [Dj1] à proposer en 1912 une théorie de «\?l'intégrale
  totale\?» qui lui permit de rétablir la validité du Théorème 4.1
  (cf.\ aussi les travaux de O.~Perron [Pe]). Cette théorie se
  révélera a posteriori essentiellement équivalente à la théorie de
  Henstock-Kurzweil, mais avec un formalisme et des justifications
  beaucoup plus compliquées.}

\section{5. Méthodes de calcul des primitives et des intégrales}

Il convient d'observer qu'il est en général impossible d'expliciter en
termes de fonctions usuelles la primitive de beaucoup de fonctions
pourtant relativement simples. Ainsi on peut montrer que $e^{x^2}$ ou
$\ln(\sin x)$ ont des primitives qui ne peuvent pas s'exprimer en
termes des fonctions trigonométriques, puissances, exponentielles,
logarithmes et leurs composées. Lorsque le calcul est possible, on
s'appuie le plus souvent sur l'une des deux formules importantes qui
suivent.  \medskip

{\bf (5.1) Formule d'intégration par parties.} Soient $u,v:[a,b]\to\bR$ 
deux fonctions dérivables. Le produit $uv$ est alors
dérivable et $(uv)'=u'v+uv'$. Par conséquent 
$uv'=(uv)'-u'v$ est intégrable
si et seulement si $u'v$ l'est, et dans ce cas
$$
\big[u(x)v(x)\big]_a^b=\int_a^b(uv)'(x)\,dx=
\int_a^bu'(x)v(x)\,dx+\int_a^bu(x)v'(x)\,dx.
$$
On a donc la formule
$$
\boxed{16}{
\int_a^bu(x)v'(x)\,dx=\big[u(x)v(x)\big]_a^b-\int_a^bu'(x)v(x)\,dx,}
$$
qui peut encore se récrire de manière plus abrégée
$$
\boxed{16}{
\int_a^bu\,dv=\big[uv\big]_a^b-\int_a^bv\,du.}
$$
En termes de primitives et avec la notation des intégrales indéfinies, 
on peut aussi écrire
$$
\boxed{16}{
\int u(x)v'(x)\,dx=u(x)v(x)-\int u'(x)v(x)\,dx.}
$$

{\bf (5.1$\,$a) Exemple.} Soit $n\ge 1$
un entier naturel, on cherche à calculer une primitive $F_n$ de 
$f_n(x) = x^n e^{-x}$. La fonction $f_n$ est déjà écrite comme produit 
de deux fonctions, que l'on sait intégrer. Intégrons par parties
en prenant $u(x)=x^n$ et $v'(x)=e^{-x}$ (d'où,~par exemple, 
$v(x)=-e^{-x}$)$\,$:
$$
\eqalign{
F_n(x)=
\int x^n e^{-x}\,dx &= \big [x^n(-e^{-x})\big ]-\int n\,x^{n-1}(-e^{-x})\,dx\cr
&=-x^n e^{-x}-n\int x^{n-1}e^{-x}\,dx = 
-x^n e^{-x}+nF_{n-1}(x)~~({}+C).\cr}
$$
Comme $F_0(x)=-e^{-x}$, cette relation de récurrence permet de calculer 
$F_n$ pour tout entier~$n\ge 1\,$:
$$
F_n(x)=-\Big(\sum_{p=0}^n n(n-1)\ldots(p+1)x^p\Big)e^{-x}~~({}+C).
$$
{\bf (5.1$\,$b) Exemple.} De même, pour $a\in\bR\ssm\{-1\}$ et $n\in\bN$, 
en posant $u'(x)=x^a$ et $v(x)=(\ln x)^n$, on trouve
$$
\eqalign{
\int x^a(\ln x)^n\,dx&={x^{a+1}\over a+1}(\ln x)^n-
\int {x^{a+1}\over a+1}{n\over x}(\ln x)^{n-1}\,dx\cr
&={x^{a+1}\over a+1}(\ln x)^n-{n\over a+1}\int x^a(\ln x)^{n-1}\,dx\cr
&={x^{a+1}\over a+1}(\ln x)^n-{n\over a+1}{x^{a+1}\over a+1}(\ln x)^{n-1}
+{n(n-1)\over (a+1)^2}\int x^a(\ln x)^{n-2}\,dx.\cr}
$$
Par récurrence, ceci donne
$$
\int x^a(\ln x)^n\,dx
=x^{a+1}\sum_{p=0}^n (-1)^p{n(n-1)\ldots (n-p+1)\over 
(a+1)^{p+1}}(\ln x)^{n-p}.
$$
\medskip

{\bf (5.2) Formule de changement de variable.} Soit $f:[a,b]\to\bR$ une 
fonction admettant une primitive $F$. On a alors
$$
\int_a^b f(x)\,dx=\big[F(x)\big]_a^b=F(b)-F(a).
$$
Il est souvent commode de changer de variable, en posant $x=\varphi(t)$
pour une certaine fonction $\varphi:[\alpha,\beta]\to[a,b]$ dérivable
telle que $\varphi(\alpha)=a$ et $\varphi(\beta)=b$ (on ne suppose pas
nécessairement $a\le b$ ni $\alpha\le\beta$). Il vient alors
$$
\int_a^b f(x)\,dx=F(\varphi(\beta))-F(\varphi(\alpha))=
\big[F\circ\varphi(t)\big]_\alpha^\beta=\int_\alpha^\beta
(F\circ\varphi)'(t)\,dt=\int_\alpha^\beta f(\varphi(t))\varphi'(t)\,dt
$$
On a donc la formule fondamentale
$$
\boxed{16}{
\int_a^b f(x)\,dx=\int_\alpha^\beta f(\varphi(t))\varphi'(t)\,dt
=\int_\alpha^\beta f\circ\varphi\, d\varphi.}
$$
En pratique, on effectue les substitutions
$$
\leqalignno{
&\boxed{8}{
x=\varphi(t),\quad dx=\varphi'(t)\,dt,\quad a=\varphi(\alpha),\quad
b=\varphi(\beta),}&\cr}
$$
en prenant soin de changer les bornes comme indiqué.
En termes d'intégrales indéfinies, si $F$ désigne une primitive de $f$,
on peut écrire
$$
\boxed{14}{
F(x)=F(\varphi(t))=\int f(\varphi(t)\varphi'(t)\,dt.}
$$
{\bf (5.2$\,$a) Exemple.} Le cas particulier 
$\dsp f(x)={1\over x}$, $F(x)=\ln|x|$ implique
$$
\int {\varphi'(t)\over \varphi(t)}\,dt= \ln|\varphi(t)|+C.
$$
De même, le cas $f(x)=\dsp{1\over 1+x^2}$, $F(x)=\arctan x$ implique
$$
\int {\varphi'(t)\over 1+\varphi(t)^2}\,dt= \arctan \varphi(t)+C.
$$
Ceci permet par exemple de trouver successivement les formules
$$
\eqalign{
&\int \tan x\,dx = \int {\sin x\over \cos x}\,dx = -\ln|\cos x|+C\cr
&\int \cotan x\,dx = \int {\cos x\over \sin x}\,dx = \ln|\sin x|+C\cr
&\int{1\over \sin x\cos x} \,dx = 
\int \Big({\cos x\over \sin x}+{\sin x\over\cos x}\Big)dx=\ln|\tan x|+C\cr
&\int {1\over \sin x}\,dx = 
\int {1\over 2\sin {x\over 2}\cos{x\over 2}}\,dx = 
\ln\Big|\tan{x\over 2}\Big|+ C\cr
&\int {1\over \cos x}\,dx = \int {1\over \sin(x+{\pi\over 2})}\,dx = 
\ln\Big|\tan\Big({x\over 2}+{\pi\over 4}\Big)\Big|
+C.
\cr}
$$
Le cas des fractions rationnelles trigonométriques générales
sera traité plus loin.
\medskip

{\bf (5.2$\,$b)* Un exemple plus élaboré.} Soit à calculer la
primitive
$$
\int {1\over \sqrt{1 + x} + \sqind{3}\sqrt{1 + x}}\,dx.
$$
On remarque que l'on a les mêmes quantités sous les deux radicaux. 
On va donc essayer de s'en débarrasser en exprimant ces radicaux comme 
puissances d'une même quantité. Le ppcm de $2$ (pour la racine 
carrée) et  $3$ (pour la racine cubique) est $6$. On va donc 
utiliser le changement de variable 
$$
y =\sqind{6}\sqrt{1 + x} = (1 + x)^{1/6}.
$$
Ainsi on a  $\sqrt{1 + x}=y^3$ et  $\sqind{3}\sqrt{1 + x}=y^2$.
Comme $y^6 = 1 + x$, il vient $6y^5\,dy=dx$ et donc
$$
\int {1\over \sqrt{1 + x} + \sqind{3}\sqrt{1 + x}}\,dx=
\int {6\,y^5\over y^3 + y^2}\,dy =\int {6\,y^3\over y + 1}\,dy,
$$
Cette dernière intégrale se calcule facilement. On commence par 
effectuer une division euclidienne de $y^3$ par $y+1$, ce qui donne
$$
y^3 = (y^2-y+1)(y+1) - 1,
$$
et par conséquent
$$
\eqalign{
{y^3 \over y+1} &= y^2 - y + 1 -{1 \over y + 1},\cr
\int{y^3\over y+1}\,dy 
&= {1\over 3}y^3 - {1\over 2}y^2 + y -\ln|1+y|+C.\cr}
$$
Il ne faut pas oublier, à la fin du calcul, de revenir à la variable $x$
en remplaçant partout $y$ par sa valeur.
Il sort alors de tout ça le résultat attendu$\,$:
$$
\int {1\over \sqrt{1 + x} + \sqind{3}\sqrt{1 + x}}\,dx
= 2\sqrt{1+x}- 3\;\sqind{3}\sqrt{1+x} + 6\;\sqind{6}\sqrt{1+x} -
6\ln\big|1+\sqind{6}\sqrt{1+x}\big|+C.
$$

{\bf (5.3) Intégration des polynômes trigonométriques.}
Pour calculer l'intégrale d'un polynôme trigonométrique
$\int P(\cos x,\sin x)\,dx$ on utilise ce qu'on appelle la 
{\it mé\-thode de linéarisation}, qui consiste à trouver une
combinaison linéaire de la forme
$$
P(\cos x,\sin x)=a_0+\sum_{1\le n\le N}a_n\cos nx+b_n\sin nx.
$$
Pour cela, on utilise les formules d'Euler
$$
\cos x={e^{ix}+e^{-ix}\over 2},\qquad \sin x={e^{ix}-e^{-ix}\over 2i},
$$
afin d'exprimer $P(\cos(x,\sin x)$ comme combinaison linéaire
des fonctions $e^{inx}$ et $e^{-inx}$. On remplace finalement ces fonctions
par $e^{\pm inx}=\cos nx\pm i\sin nx$ (ou bien, si $P$ est réel, on prend
la partie réelle du résultat. Par exemple
$$
\eqalign{
\cos^2x\;\sin^3 x&=\Big({e^{ix}+e^{-ix}\over 2}\Big)^2
\Big({e^{ix}-e^{-ix}\over 2i}\Big)^3\cr
&={i\over 2^5}\big(e^{2ix}+2+e^{-2ix}\big)
\big(e^{3ix}-3\,e^{ix}+3\,e^{-ix}-e^{-3ix}\big)\cr
&={i\over 32}\Big(e^{5ix}-e^{3ix}-2\,e^{ix}+2\,e^{-ix}+e^{-3ix}-e^{-5ix}
\Big)\cr
&={1\over 16}\big(-\sin 5x+\sin 3x+2\sin x\big).\cr}
$$
On obtient alors
$$
\int \cos^2x\;\sin^3 x\,dx=
{1\over 16}\Big({1\over 5}\cos 5x-{1\over 3}\cos 3x-2\cos x\Big)+C.
$$
Plus généralement, toute expression polynomiale $P(e^{a_jx},\cos b_kx,
\sin c_\ell x)$ se ramène à une combinaison linéaire d'exponentielles
complexes, et peut donc se traiter d'une manière analogue.
\medskip

{\bf (5.4) Intégration des fractions rationnelles.}  Une fraction
rationnelle est une fonction définie comme le quotient $P/Q$ de deux
polynômes $P$ et $Q$ à coefficients réels ou complexes (en
algèbre on s'intéresse aussi aussi au cas où les coefficients
sont pris dans un corps quelconque$\,$; le cas du corps $\bQ$ des
rationnels est bien sûr très usuel). La~fonction $P/Q$ est
définie sur $\bC$ privé des racines de $Q$, que l'on appelle les
{\it pôles} de la fraction rationnelle. La division euclidienne de
$P$ par $Q$ s'écrit $P=EQ+R$ avec un quotient $E$ et un reste $R$
qui sont des polynômes tels que $\deg R<\deg Q$. On a alors
$$
{P\over Q}= E+{R\over Q}.
$$
Le quotient $E$ s'appelle aussi {\it la partie entière} de la fraction 
rationnelle, et $R/Q$ la {\it partie polaire}. Elle est telle que
$\lim_{x\to\infty}R(x)/Q(x)=0$.

{\bf (5.4$\,$a) Cas où $P/Q$ possède un seul pôle.} C'est
le cas où $Q(x)=(x-\alpha)^m$. En écrivant $R$ comme un polynôme
en $X=x-\alpha$, soit $R(x)=\sum_{0\le j<m} c_j(x-\alpha)^j$, on~voit
que $P/Q$ admet une écriture de la forme
$$
{P(x)\over Q(x)}=E(x)+\sum_{j=1}^m{\lambda_j\over (x-\alpha)^j}.
$$
Si $\alpha$ est réel, la primitive se calcule sans peine puisque
$$
\int {1\over x-\alpha}\,dx=\ln|x-\alpha|+C,\qquad
\int {1\over (x-\alpha)^j}\,dx=-{1\over j-1}{1\over (x-\alpha)^{j-1}}+C\quad
\hbox{si $j>1$}.
$$
{\bf (5.4$\,$b) Cas où $Q$ est un trinôme du second degré.} Si
$Q(x)=ax^2+bx+c$, le calcul des racines réelles ou complexes donne
une factorisation $Q(x)=a(x-\alpha)(x-\beta)$. Si les racines
$\alpha$, $\beta$ sont réelles et distinctes, on écrit
$$
{1\over(x-\alpha)(x-\beta)}=
{1\over\alpha-\beta} \Big(
{1\over x-\alpha}-{1\over x-\beta}\Big),
$$
ce qui donne aussitôt
$$
\int{1\over(x-\alpha)(x-\beta)}\,dx=
{1\over\alpha-\beta}\ln\bigg|{x-\alpha\over x-\beta}\bigg|+C.
$$
Dans le cas d'un trinôme réel $ax^2+bx+c$ de discriminant
$\Delta=b^2-4ac<0$, les racines sont complexes et on procède différemment.
On a en effet
$$
Q(x)=a\Big(\Big(x+{b\over 2a}\Big)^2-{\Delta\over 4a^2}\Big)=
a\big((x-\gamma)^2+\delta^2\big)
$$
avec $\gamma=-b/2a$ et $\delta=\sqrt{|\Delta|}/2|a|$, les racines complexes
étant $\alpha=\gamma+i\delta$, $\ovl\alpha=\gamma-i\delta$. Après division
euclidienne de $P$ par $Q$, on est ramené à intégrer des expressions
de la forme
$$
\int {\lambda x+\mu\over (x-\gamma)^2+\delta^2}\,dx.
$$
Dans ce cas on écrit $\lambda x+\mu=\lambda(x-\gamma)+(\lambda\gamma+\mu)$
et on observe que $(x-\gamma)$ est la moitié de la dérivée du dénominateur,
ce qui donne
$$
\eqalign{
\int {\lambda x+\mu\over (x-\gamma)^2+\delta^2}\,dx&=
\int {\lambda(x-\gamma)\over (x-\gamma)^2+\delta^2}\,dx+
\int {\lambda\gamma+\mu\over (x-\gamma)^2+\delta^2}\,dx\cr
&={1\over 2}\lambda\ln\big((x-\gamma)^2+\delta^2\big)+
(\lambda\gamma+\mu)\int {1\over (x-\gamma)^2+\delta^2}\,dx\cr
&={1\over 2}\lambda\ln\big((x-\gamma)^2+\delta^2\big)+
{\lambda\gamma+\mu\over\delta}\arctan{x-\gamma\over\delta}+C.\cr
}
$$
{\bf (5.4$\,$c)** Cas général.} Un théorème fondamental d'algèbre 
affirme que tout poly\-nôme non constant $Q$ de degré $d$ à coefficients 
complexes admet exactement $d$ racines\break complexes comptées avec 
multiplicité, ce qui permet de le factoriser sous la forme
$Q(x)=c\prod_{1\le j\le s}(x-\alpha_j)^{m_j}$ avec
$m_1+\ldots+m_s=d$. On va alors montrer par récurrence sur le degré
$d$ de $Q$ que la partie polaire~$R/Q$, $\deg R<\deg Q$, s'écrit comme
combinaison linéaire de termes $1/(x-\alpha_j)^\ell$ n'ayant comme pôle
qu'un seul des $\alpha_j$ à la fois$\,$:
$$
{R(x)\over Q(x)}=
\sum_{j=1}^s\sum_{\ell=1}^{m_j}{\lambda_{j,\ell}\over(x-\alpha_j)^\ell}.
$$
Le résultat est vrai (et trivial) pour $d=1$, puisque dans ce cas
$Q(x)=c(x-\alpha)$ et $R$~doit être une constante. D'après le 
raisonnement (5.4$\,$a),
le résultat est encore vrai si $Q$ n'a qu'une seule
racine. Supposons donc que $Q$ ait au moins 2 racines distinctes
$\alpha_1$,~$\alpha_2$, et cherchons à simplifier l'écriture de
chaque terme
$$
{x^k\over(x-\alpha_1)^{m_1}(x-\alpha_2)^{m_2}\ldots
(x-\alpha_s)^{m_s}},\qquad k<d,
$$
provenant des différents monômes $x^k$ de $R(x)$. Pour cela, on effectue 
la substitution
$$
\eqalign{
&{1\over(x-\alpha_1)(x-\alpha_2)}=
{1\over \alpha_2-\alpha_1}
\bigg({1\over x-\alpha_1}-{1\over x-\alpha_2}\bigg)\qquad
\hbox{si $k=0$},\cr
&{x\over(x-\alpha_1)(x-\alpha_2)}=
{1\over \alpha_1-\alpha_2}
\bigg({\alpha_1\over x-\alpha_1}-{\alpha_2\over x-\alpha_2}\bigg)\qquad
\hbox{si $k\ge 1$},\cr}
$$
ce qui fournit deux termes dont dénominateur est de degré
$d'=d-1$ et dont le numérateur est de degré${}<d'$. Par hypothèse
de récurrence, ces termes se décomposent sous la forme voulue.
Le résultat cherché s'ensuit d'après l'hypothèse de récurrence.

La décomposition de $P/Q$ qui en résulte, c'est-à-dire
$$
{P(x)\over Q(x)}= E(x)+
\sum_{j=1}^s\sum_{\ell=1}^{m_j}{\lambda_{j,\ell}\over(x-\alpha_j)^\ell}
$$
s'appelle {\it décomposition de $P/Q$ en éléments simples}. Dans le
cas où la fraction $P/Q$ est réelle, il peut tout de même y avoir des
racines complexes, mais si $c/(x-\alpha)^\ell$ est un terme complexe,
on peut écrire que $P/Q=\Re(P/Q)$ et remplacer $c/(x-\alpha)^\ell$
par
$$
\eqalign{
\Re\Big({c\over (x-\alpha)^\ell}\Big)
&={1\over 2}\Big({c\over (x-\alpha)^\ell}+
{\ovl c\over (x-\ovl\alpha)^\ell}\Big)
={1\over 2}\Big({c(x-\ovl\alpha)^\ell+\ovl c(x-\alpha)^\ell
\over (x-\alpha)^\ell(x-\ovl\alpha)^\ell}\Big)\cr
&={A(x)\over \big((x-\gamma)^2+\delta^2\big)^\ell}\cr}
$$
où $\alpha=\gamma+i\delta$ et où $A$ est un polynôme réel
de degré $\ell$.  En posant $y=x-\gamma$ et en faisant des divisions
euclidiennes de $A$ (exprimé comme polynôme de la variable $y$) par
$y^2+\delta^2$, on se ramène de manière évidente à une somme
de termes de la forme
$$
{uy+v\over(y^2+\delta^2)^j},\qquad j\le \ell.\leqno(*)
$$
Ceci donne une {\it décomposition en éléments simples réels}
du type
$$
{P(x)\over Q(x)}= E(x)+
\sum_{j=1}^p\sum_{\ell=1}^{m_j}{\lambda_{j,\ell}\over(x-\alpha_j)^\ell}+
\sum_{j=1}^q\sum_{\ell=1}^{m'_j}{u_{j,\ell}(x-\gamma_j)+v_{j,\ell}
\over \big((x-\gamma_j)^2+\delta_j^2\big)^\ell}
$$
où les $\alpha_j$ sont les racines réelles de multiplicités $m_j$, et
les $\gamma_j\pm i\delta_j$ les racines complexes (deux à deux
conjuguées) de multiplicités $m'_j$. Pour calculer les primitives des 
termes $(*)$ de la dernière sommation, on observe qu'on a d'une part
$$
\int {y\over(y^2+\delta^2)^\ell}\,dy=
-{1\over (2\ell-2)}{1\over(y^2+\delta^2)^{\ell-1}}+C,
$$
et d'autre part
$$
\eqalign{
\int {1\over(y^2+\delta^2)^\ell}\,dy
&={1\over\delta^2}\int {(y^2+\delta^2)-y^2\over(y^2+\delta^2)^\ell}\,dy\cr
&={1\over\delta^2}\int {1\over(y^2+\delta^2)^{\ell-1}}\,dy
-{1\over\delta^2}\int {y\cdot y\over(y^2+\delta^2)^{\ell-1}}\,dy.\cr}
$$
Une intégration par parties fournit
$$
\int {y\cdot y\over(y^2+\delta^2)^\ell}\,dy=
-{1\over 2(\ell-1)}{y\over(y^2+\delta^2)^{\ell-1}}+
{1\over 2(\ell-1)}\int {1\over(y^2+\delta^2)^{\ell-1}}\,dy.
$$
En combinant ces égalités, on trouve
$$
\int {1\over(y^2+\delta^2)^\ell}\,dy=
{1\over 2(\ell-1)\delta^2}{y\over(y^2+\delta^2)^{\ell-1}}+
{2\ell-3\over 2\ell-2}{1\over\delta^2}\int{1\over(y^2+\delta^2)^{\ell-1}}\,dy,
$$
ce qui permet un calcul de la primitive par récurrence sur~$\ell$. 
On substitue {\it in fine} $y=x-\gamma$ pour revenir à l'expression
cherchée en la variable~$x$.

Le calcul pratique de la décomposition en éléments simples
peut être pénible, et nous ne traiterons ici qu'un exemple.

{\bf (5.4$\,$d)* Exemple.} Soit à calculer l'intégrale indéfinie
$$
F(x)=\int {1\over x^3(1+x^3)}\,dx.
$$
Le dénominateur ne s'annule qu'en $0$ et $-1$, donc la fonction à 
intégrer est continue sur $\bR\ssm\{0,-1\}$, de sorte qu'elle y
admet des primitives sur les trois intervalles $]-\infty,-1[$, $]-1,0[$,
$]0,+\infty[$. On peut commencer par observer que
$$
{1\over x^3(1+x^3)} ={1\over x^3}-{1\over(1 + x^3)}.
$$
Pour le second terme on remarque que $1+x^3$ a pour racines dans $\bC$ 
les nombres complexes $-1$, $e^{i\pi/3}$ et $e^{-i\pi/3}$. Ainsi   
$$
1+x^3=(x+1)(x-e^{i\pi/3})(x-e^{-i\pi/3})=(x+1)(x^2-x+1).
$$
Les pôles de $1/(1+x^3)$ sont de multiplicité $1$ (les racines de $1+x^3$ 
sont distinctes) -- on parle alors de {\it pôles simples} -- et donc la 
décomposition en éléments simples prend la forme
$$
{1\over 1 + x^3} = {a\over x+1} + 
{b\over x-e^{i\pi/3}} + {c\over x-e^{-i\pi/3}}
$$
avec des nombres complexes $a,\,b,\,c$ à déterminer. Pour trouver 
leurs valeurs, on observe que $a/(x+1)$ est un équivalent de la partie polaire 
quand $x\to -1$. Or, un équivalent de $1+x^3$ au voisinage 
d'une racine $x=\alpha$ est précisément $3\alpha^2(x-\alpha)$ puisque 
la dérivée vaut~$3x^2$. Ceci donne pour $1/(1+x^3)$ l'équivalent 
${1\over 3\alpha^2}{1\over x-\alpha}$ et on en déduit
$$
a={1\over 3},\qquad 
b=\Big({1\over 3\alpha^2}\Big)_{\alpha=e^{i\pi/3}}=-{1\over 3}e^{i\pi/3},
\qquad
c=\Big({1\over 3\alpha^2}\Big)_{\alpha=e^{-i\pi/3}}=-{1\over 3}e^{-i\pi/3}.
$$
On obtient par conséquent la décomposition en éléments simples
$$
\eqalign{
{1\over 1+x^3}
&={1\over 3}{1\over 1+x}-{1\over 3}{e^{i\pi/3}\over x-e^{i\pi/3}}
-{1\over 3}{e^{-i\pi/3}\over x-e^{-i\pi/3}}\cr
&={1\over 3}{1\over 1+x}-{1\over 3}{x(e^{i\pi/3}+e^{-i\pi/3})-2
\over (x-e^{i\pi/3})(x-e^{-i\pi/3})}
={1\over 3}{1\over 1+x}+{1\over 3}{2-x\over x^2-x+1}.\cr}
$$
On aurait pu aussi chercher directement la décomposition en éléments simples
réels sous la forme
$$
{1\over 1 + x^3} = {a\over x+1} + {bx+c\over x^2-x+1},
$$
et procéder par identification à partir de l'égalité
$1=a(x^2-x+1)+(bx+c)(x+1)$ qui donne $a+c=1$, $-a+b+c=0$ et $a+b=0$.
On aboutit ainsi à
$$
{1\over x^3(1+x^3)}
={1\over x^3}-{1\over 3}{1\over 1+x}-{1\over 3}{2-x\over x^2-x+1}.
$$
Pour le dernier terme, on écrit
$$
{2-x\over x^2-x+1}={2-x\over (x-{1\over 2})^2+{3\over 4}}=
{{3\over 2}-(x-{1\over 2})\over (x-{1\over 2})^2+{3\over 4}}
$$
de façon à faire apparaître la dérivée du dénominateur au numérateur. 
Ceci donne
$$
\eqalign{
\int{2-x\over x^2-x+1}\,dx
&={3\over 2}{1\over{\sqrt{3}\over 2}}
\arctan{x-{1\over 2}\over{\sqrt{3}\over 2}}
-{1\over 2}\ln\textstyle\big((x-{1\over 2})^2+{3\over 4}\big)+C\cr
&=\sqrt{3}\arctan{2x-1\over\sqrt{3}}
-{1\over 2}\ln\big(x^2-x+1\big)+C\cr}
$$
à l'aide de la méthode de (5.4$\,$b). Au total nous trouvons
$$
\int{1\over x^3(1+x^3)}\,dx=
-{1\over 2}{1\over x^2}-{1\over 3}\ln|1+x|
-{1\over\sqrt{3}}\arctan {2x-1\over\sqrt{3}}
+{1\over 6}\ln(x^2-x+1)+C.
$$
Comme on peut le voir, les calculs sont fastidieux, mais, dès que 
l'on connaît les pôles de la fraction rationnelle (i.e.\ les racines du 
dénominateur), ils deviennent  automatiques.
\medskip

{\bf (5.4$\,$e)* Fractions rationnelles trigonométriques.} 
Une mé\-thode générale pour le calcul des primitives de 
fractions rationnelles $P(\cos x,\sin x)/Q(\cos x,\sin x)$
en sinus et cosinus consiste à utiliser les
formules de trigonométrie suivantes : si l'on pose $t =\tan(x/2)$, alors
$$
\cos x = {1-t^2\over 1+t^2}\quad\hbox{et}\quad \sin x = {2t\over 1+t^2}.
$$
On obtient par ailleurs $x=2\arctan t$, d'où
$$
dx = {2\,dt\over 1 + t^2}.
$$
On en déduit que
$$
\int {P(\cos x,\sin x)\over Q(\cos x,\sin x)}\,dx=
\int{ P\big((1-t^2)(1+t^2)^{-1}\;,\;(2t)(1 + t^2)^{-1}\big)\over
 Q\big((1-t^2)(1 + t^2)^{-1}\;,\;(2t)(1 + t^2)^{-1}\big) }\;
{2\,dt \over 1 + t^2}.
$$
C'est une intégrale de fraction rationnelle en $t$, et on sait donc
en calculer une primitive d'après ce qui précède. Pour une fraction 
rationnelle en $\cosh x$ et $\sinh x$, on peut poser de même
$t=\tanh x/2\in{}]-1,1[$, ce qui donne $dx=2dt/(1-t^2)$ et
$$
\cosh x={1+t^2\over 1-t^2},\qquad \sinh x={2t\over 1-t^2}.
$$
\medskip

\section{6. Calcul d'aires et de volumes}

Nous commencerons par une application concrète très importante qui est
le calcul des aires et des volumes.
\medskip

{\bf (6.1) Calcul d'aires${}^{(10)}$.} Par définition même, 
l'intégrale d'une fonction $f$ calcule l'aire algébrique située sous
son graphe. Pour un domaine plan quelconque, 
la frontière est en général délimitée par les graphes de
plusieurs fonctions (deux au moins, davantage si le domaine comporte
des «\?trous\?» ou des «\?renfoncements\?»).

\vbox{%
\InsertFig 10.000 60.000 {
1 mm unit
  5.000  10.000 moveto  97.000   0.000 2.4 vector 
 10.000   5.000 moveto  45.000  90.000 2.4 vector 
  0.200 setlinewidth
 18.000  24.000 moveto 
[  18.000  24.000
   18.000  24.500   25.000  27.000   38.000  49.000   46.000  40.000 
   56.000  44.000   60.000  32.000   75.000  40.000   80.000  40.500  
   80.000  40.000   80.000  39.500
   72.000  20.000   55.000  16.000   32.000  15.000   18.000  23.500
] curve closepath
gsave
  0.940   0.960   0.980 setrgbcolor  fill
 48.000  15.000 moveto   50.000  15.000 lineto  
 50.000  40.000 lineto   48.000  40.000 lineto 
 closepath
  gsave
  1.000   0.840   0.840 setrgbcolor fill
  grestore
  1.000   0.000   0.000 setrgbcolor stroke
grestore
  stroke
  0.000 setgray
[ 1.000   0.500 ] 0 setdash
 18.000  11.200 moveto  18.000  24.000 lineto stroke
 80.000  11.200 moveto  80.000  40.000 lineto stroke
 48.000  11.200 moveto  48.000  15.000 lineto stroke
 50.000  11.200 moveto  50.000  15.000 lineto stroke
[ ] 0 setdash
 48.000  14.800 moveto   0.7 disk
 48.000  40.200 moveto   0.7 disk
  0.339 setlinewidth
 18.000  10.000 moveto   0.700   0.000 indent 
 48.000  10.000 moveto   0.700   0.000 indent 
 50.000  10.000 moveto   0.700   0.000 indent 
 80.000  10.000 moveto   0.700   0.000 indent 
}
\LabelTeX   32.000  26.500 $A$\ELTX
\LabelTeX   17.000   6.500 $a$\ELTX
\LabelTeX   79.300   6.500 $b$\ELTX
\LabelTeX   45.500   6.200 $x$\ELTX
\LabelTeX   48.500   6.200 $x+dx$\ELTX
\LabelTeX    6.200  48.000 $y$\ELTX
\LabelTeX   40.500  17.750 $f(x)$\ELTX
\LabelTeX   40.500  36.500 $g(x)$\ELTX
\LabelTeX   50.800  26.500 $\ell(x)\,dx$\ELTX
\EndFig
\centerline{{\bf Fig.~9.} Aire d'un domaine délimité par des graphes
de fonctions.}}

\smallskip
Comme on le voit par soustraction des aires situées sous les 
graphes de $f$ et $g$ respectivement (et en remplaçant si nécessaire $f$,
$g$ par $f+C$, $g+C$ pour avoir des fonctions positives), l'aire du domaine 
plan est égale à la différence 
$$
A=\int_a^b g(x)\,dx-\int_a^b f(x)\,dx.
$$
L'aire d'un tel domaine plan est donc donnée par l'intégrale par
rapport à $x$ de la longueur $\ell(x)=g(x)-f(x)$ des sections 
«\?verticales\?» du domaine~:
$$
\boxed{16}{
A =\int_a^b\ell(x)\,dx=\int_a^b \big(g(x)-f(x)\big)\,dx.
}
$$
À titre d'exemple, cherchons l'aire délimitée par l'ellipse
${x^2\over a^2}+{y^2\over b^2}=1$, de demi-axes $a$ et $b$. Le domaine
délimité par l'ellipse est compris entre les graphes des fonctions
$g(x)=b\sqrt{1-(x/a)^2}$ et $f(x)=-g(x)$ pour $x\in[-a,a]$, ce qui donne
$$
A =\int_{-a}^a2g(x)\,dx=2b\int_{-a}^a \sqrt{1-{x^2\over a^2}}\,dx.
$$
Le changement de variable $x=a\sin t$ avec $t\in[-\pi/2,\pi/2]$ donne 
$dx=a\cos t\,dt$, d'où
$$
A=2ab\int_{-\pi/2}^{\pi/2}\cos^2(t)\,dt=
2ab\int_{-\pi/2}^{\pi/2}{1+\cos 2t\over 2}\,dt=\pi ab.\eqno\square
$$

{\bf (6.2) Calcul de volumes\note{10}{La définition de
l'aire (et de même du volume), pour des domaines «\?mesurables\?» 
arbitraires de $\smash{\bR^2}$ et de $\smash{\bR^3}$ requiert des 
concepts sophistiqués de la théorie de l'intégration que nous ne 
pouvons pas développer ici. La démonstration complète des
formules 6.1 et 6.2 s'appuie ainsi sur le célèbre théorème dit
de Fubini. Nous renvoyons à la section 9 du chapitre III
pour une preuve détaillée dans le cadre de la théorie des
ensembles mesurables. Il n'est pas incorrect ici de
considérer que les formules données pour la surface et le volume 
sont en quelque sorte des définitions de ces grandeurs.}.} La procédure
est essentiellement la même~:
on effectue des sections planes (disons par exemple en coupant par un plan 
horizontal $z=\hbox{Cte}$), et on suppose connue l'aire $S(z)$ d'une 
telle section plane (cette aire aura en général été évaluée 
elle-même par un calcul intégral comme expliqué au paragraphe 6.1).

\vbox{%
\InsertFig 10.000 55.000 {
1 mm unit
  5.000  10.000 moveto  97.000   0.000 2.4 vector 
 10.000   5.000 moveto  45.000  90.000 2.4 vector 
[ 1.000   0.500 ] 0 setdash
 11.200  32.000 moveto  29.100  32.000 lineto stroke
 11.200  34.000 moveto  29.100  34.000 lineto stroke
 11.200  14.000 moveto  43.000  14.000 lineto stroke
 11.200  44.000 moveto  37.000  44.000 lineto stroke
[ ] 0 setdash
  0.200 setlinewidth
 18.000  24.000 moveto 
[  18.000  24.000
   18.000  24.500   25.000  27.000   38.000  44.000   46.000  40.000 
   56.000  43.000   60.000  42.000   75.000  41.000   80.000  40.500  
   80.000  40.000   80.000  39.500
   72.000  20.000   55.000  16.000   32.000  15.000   18.000  23.500
] curve closepath
gsave
  0.940   0.960   0.980 setrgbcolor  fill
 29.100  32.000 moveto   79.100  32.000 lineto  
 79.100  34.000 lineto   29.100  34.000 lineto
 closepath
  gsave
  1.000   0.840   0.840 setrgbcolor fill
  grestore
  1.000   0.000   0.000 setrgbcolor stroke
grestore
  0.000 setgray stroke
  0.339 setlinewidth
 10.000  14.000 moveto   0.700  90.000 indent 
 10.000  44.000 moveto   0.700  90.000 indent
 10.000  32.000 moveto   0.700  90.000 indent
 10.000  34.000 moveto   0.700  90.000 indent 
}
\LabelTeX   46.000  22.500 $V$\ELTX
\LabelTeX    6.500  43.500 $b$\ELTX
\LabelTeX    6.500  13.000 $a$\ELTX
\LabelTeX    6.500  29.800 $z$\ELTX
\LabelTeX   -1.000  34.200 $z+dz$\ELTX
\LabelTeX   96.000   6.200 $x,\,y$\ELTX
\LabelTeX    6.200  49.000 $z$\ELTX
\LabelTeX   47.800  35.500 $S(z)\,dz$\ELTX
\EndFig
\vskip-6pt
\centerline{{\bf Fig.~10.} Calcul d'un volume par tranchage dans la 
direction~$z$.}}
\smallskip
Dans ce cas, le volume est donné par
$$
\boxed{16}{
V=\int_a^b S(z)\,dz.}
$$
Une application immédiate est le calcul du volume de la boule de
rayon $R$ d'équation $x^2+y^2+z^2\le R^2$.
L'aire de la section $z=\hbox{Cte}$ est l'aire $S(z)=\pi(R^2-z^2)$
du disque $x^2=y^2\le R^2-z^2$ de rayon $\sqrt{R^2-z^2}$. On trouve donc
$$
V=\int_{-R}^R\pi(R^2-z^2)\,dz=2\pi\int_0^R(R^2-z^2)\,dz
=2\pi\big[R^2z-z^3/3\big]_0^R={4\over 3}\pi R^3.
$$
Une autre application est la formule donnant le volume d'un cône 
-- éventuellement «\?oblique\?» -- ayant une base
d'aire $A$ connue et une hauteur $h$. 
On entend ici par cône la réunion des segments issus d'un point
(sommet), ayant pour autre extrêmité un point quelconque d'un
domaine plan (choisi comme base).  Pour faire le calcul, il est
commode de choisir le sommet du cône comme origine et de fixer
un repère orthonormé tel que la base du cône soit contenue dans 
le plan~$z=h$.

\InsertFig 20.000 54.000 {
1 mm unit
 10.000   2.000 moveto   46 90 2.4 vector
 10.000   6.000 moveto   0.7 90 indent
 10.000  24.000 moveto   0.7 90 indent
 10.000  25.500 moveto   0.7 90 indent
 10.000  36.000 moveto   0.7 90 indent
 35.000   6.000 moveto   17.900  36.000 lineto stroke
 35.000   6.000 moveto   59.800  36.200 lineto stroke
 18.000  36.000 moveto 
[  18.000  36.000   25.000  39.000   38.000  44.000   
   46.000  41.000   56.000  41.000   60.000  38.000   52.000  33.000
   42.000  31.000   32.000  33.000   22.000  34.000
] closedcurve
gsave
  0.940   0.960   0.980 setrgbcolor  fill
grestore stroke
gsave
 35.000   6.000 translate
  0.6 0.6 scale
-35.000  -6.000 translate
 18.000  36.000 moveto 
[  18.000  36.000   25.000  39.000   38.000  44.000   
   46.000  41.000   56.000  41.000   60.000  38.000   52.000  33.000
   42.000  31.000   32.000  33.000   22.000  34.000
] closedcurve
gsave
  0.980   0.960   0.940 setrgbcolor  fill
grestore stroke
grestore
}
\LabelTeX   37.000  23.000 $S(z)$\ELTX
\LabelTeX    6.200  46.000 $z$\ELTX
\LabelTeX    6.200  35.000 $h$\ELTX
\LabelTeX    6.200  22.500 $z$\ELTX
\LabelTeX   -1.700  25.000 $z+dz$\ELTX
\LabelTeX    6.200   5.000 $0$\ELTX
\LabelTeX   42.800  35.500 $A$\ELTX
\LabelTeX   56.800  28.500 $V$\ELTX
\EndFig
\centerline{{\bf Fig.~11.} Calcul du volume d'un cône.}
\medskip

Comme l'aire de l'homothétique de rapport $\lambda$ d'un domaine plan 
est multipliée par~$\lambda^2$, et comme le domaine d'aire $S(z)$ est 
homothétique du domaine d'aire $A$ dans le rapport $\lambda=z/h$, on a
$$
S(z)={z^2\over h^2}A.
$$
On en déduit que le volume du cône vaut
$$
V=\int_0^h S(z)\,dz
=\int_0^h {z^2\over h^2}A\,dz=\Big[{1\over 3}z^3\Big]_0^h{1\over h^2}A, 
$$
ce qui prouve la formule classique
$$
V={1\over 3}Ah.
$$
On peut appliquer le même raisonnement pour un cône
sphérique, c'est-à-dire un cône ayant pour sommet le centre
d'une sphère, et pour base un domaine de cette sphère (plutôt qu'un
domaine plan). Si $R$ est le rayon de la sphère et $A$ l'aire du domaine
sphérique, on trouve alors comme précédemment $V={1\over 3}AR$.

Dans le cas où la base est la sphère toute entière, le cône
est la boule elle-même, d'où $V={4\over 3}\pi R^3$. On en déduit
ainsi la valeur de l'aire de la sphère
$$
A=4\pi R^2.
$$
\medskip

\section{7. Encadrement par des fonctions en escalier. Intégrabilité
des fonctions continues ou monotones par morceaux}
\vskip-19pt\ \kern288pt\note{11}{%
À partir de ce point, le niveau théorique de l'exposé augmente 
sensiblement, nous considérons donc que cela relève plutôt de
l'enseignement supérieur -- le théorème (7.10) peut être admis
d'emblée en Terminale si l'on souhaite ensuite être en mesure
d'énoncer et de démontrer le corollaire 7.7.}
\vskip8pt
\sectionrunning{7. Encadrement par des fonctions en escalier et 
intégrabilité}

Nous nous proposons de démontrer ici que quelques classes usuelles de 
fonctions (no-tam\-ment les fonctions continues ou monotones par morceaux) sont
intégrables.

Soit $f:[a,b]\to\bR$ une fonction bornée. L'idée est de
considérer des encadrements
$$\varphi\le f\le\psi\leqno(7.1)
$$
de $f$ par des fonctions en escalier $\varphi,\,\psi$, comme figuré sur 
le schéma ci-dessous.

\InsertFig 10.000 65.000 {
/squeeze { /y2 exch 10.0 add def  /y1 exch 10.0 add def 
           /a2 exch def  /a1 exch def
   0.84 setgray
   a1 y1 moveto  a2 y1 lineto  a2 y2 lineto a1 y2 lineto closepath fill
   0.000   0.000   1.000 setrgbcolor
   a1 y1 moveto  a2 y1 lineto  stroke
   1.000   0.000   0.000 setrgbcolor
   a1 y2 moveto  a2 y2 lineto  stroke
   } def
/vertdash { /y exch 10.0 add def /x exch def
   x 10.0 moveto  x y lineto stroke } def
1 mm unit
  0.000 setgray
  5.000  10.000 moveto  97.000   0.000 2.4 vector 
 10.000   5.000 moveto  55.000  90.000 2.4 vector 
  0.250 setlinewidth
 18.000  23.000  14.000  15.900 squeeze
 23.000  27.000  15.900  18.800 squeeze
 27.000  32.000  18.800  33.700 squeeze
 32.000  36.000  33.700  39.100 squeeze
 36.000  39.000  38.500  39.300 squeeze
 39.000  43.000  22.000  38.500 squeeze
 43.000  47.000  19.800  22.000 squeeze
 47.000  50.000  20.000  21.600 squeeze
 50.000  53.000  21.600  23.500 squeeze
 53.000  57.000  23.300  24.300 squeeze
 57.000  60.000  12.000  23.300 squeeze
 60.000  63.000  11.100  12.000 squeeze
 63.000  65.000  11.700  14.200 squeeze
 65.000  68.000  14.200  21.300 squeeze
 68.000  71.000  21.300  26.900 squeeze
 71.000  74.000  26.900  29.650 squeeze
 74.000  80.000  29.650  30.300 squeeze
  0.000 setgray
  0.200 setlinewidth
 18.000  24.000 moveto 
[  18.000  24.000   25.000  27.000   38.000  49.000   46.000  30.000 
   56.000  34.000   60.000  22.000   75.000  40.000   80.000  40.000  
] curve 
  stroke
  0.400 setgray
  0.113 setlinewidth
[ 1.000   0.500 ] 0 setdash
 18.000  14.000 vertdash
 23.000  15.900 vertdash
 27.000  18.800 vertdash
 32.000  33.700 vertdash
 36.000  39.300 vertdash
 39.000  38.500 vertdash
 43.000  22.000 vertdash
 47.000  20.000 vertdash
 50.000  21.600 vertdash
 53.000  23.300 vertdash
 57.000  23.100 vertdash
 60.000  12.000 vertdash
 63.000  11.700 vertdash
 65.000  14.200 vertdash
 68.000  21.300 vertdash
 71.000  26.900 vertdash
 74.000  29.650 vertdash
 80.000  30.100 vertdash
  0.000   0.000   1.000 setrgbcolor
 10.000  28.800 moveto  27.000  28.800 lineto stroke
  1.000   0.000   0.000 setrgbcolor
 10.000  43.700 moveto  27.000  43.700 lineto stroke
  0.000 setgray
  0.339 setlinewidth
 18.000  10.000 moveto   0.700   0.000 indent 
 27.000  10.000 moveto   0.700   0.000 indent 
 32.000  10.000 moveto   0.700   0.000 indent 
 80.000  10.000 moveto   0.700   0.000 indent 
}
\LabelTeX   17.000   6.500 $a$\ELTX
\LabelTeX   79.300   6.500 $b$\ELTX
\LabelTeX   25.500   6.500 $u_i$\ELTX
\LabelTeX   30.500   6.500 $u_{i+1}$\ELTX
\LabelTeX  100.500   6.200 $x$\ELTX
\LabelTeX    6.200  28.400 $\RGBColor{0 0 1}{c_i}$\ELTX
\LabelTeX    6.200  43.000 $\RGBColor{1 0 0}{d_i}$\ELTX
\LabelTeX    6.200  58.000 $y$\ELTX
\LabelTeX   28.500  26.200 $\RGBColor{0 0 1}{\varphi}$\ELTX
\LabelTeX   28.500  45.500 $\RGBColor{1 0 0}{\psi}$\ELTX
\LabelTeX   24.600  36.500 $f$\ELTX
\EndFig
\vskip-10pt
\centerline{{\bf Fig.~12.} Encadrement d'une fonction bornée $f$ par des 
fonctions en escalier.}
\vskip7pt

On peut supposer ici que les fonctions en escalier $\varphi$ et $\psi$
sont exprimées au moyen de la même subdivision
$a=u_0<u_1<\ldots<u_p=b$, sinon il est toujours possible de redécouper
les subdivisions qui les définissent pour arriver à une
subdivision commune [de plus, comme les valeurs $\varphi(u_i)$, $\psi(u_i)$
ne jouent pas de rôle dans les intégrales, on peut choisir par exemple
$\varphi(u_i)=\psi(u_i)=f(u_i)\,$]. Dans cette situation, l'erreur due
à l'encadrement de l'aire est précisément
$$
\int_a^b\psi(x)\,dx-\int_a^b\varphi(x)\,dx=
\sum_{0\le i\le p-1}(d_i-c_i)(u_{i+1}-u_i)\leqno(7.2)
$$
(somme des aires des rectangles dessinés en grisé sur la Fig.~12). 
On obtient ainsi le
\medskip

{\bf (7.3) Critère d'intégrabilité au sens de Riemann}.
{\it Soit $f:[a,b]\to\bR$ une fonction. On suppose que pour tout
$\varepsilon>0$ il existe un
encadrement $\varphi\le f\le \psi$ de $f$ par des fonctions en escalier
$\varphi$, $\psi$ telles que
$$
\boxed{16}{
\int_a^b\psi(x)\,dx-\int_a^b\varphi(x)\,dx
=\sum_{0\le i\le p-1}(d_i-c_i)(u_{i+1}-u_i)\le \varepsilon.}
$$
Alors $f$ est intégrable au sens de Riemann sur $[a,b]$ et on a
$$
\boxed{16}{
\int_a^bf(x)\,dx=\sup\Big\{\int_a^b\varphi(x)\,dx\,;\;\varphi\le f\Big\}
=\inf\Big\{\int_a^b\psi(x)\,dx\,;\;\psi\ge f\Big\}.}
$$}

{\it Démonstration.} Considérons les ensembles de valeurs prises par
les intégrales de fonctions en escalier $\varphi$ qui minorent et 
$\psi$ qui majorent, c'est-à-dire
$$
E_1=\Big\{\int_a^b\varphi(x)\,dx\,;\;\varphi\le f\Big\},\quad
E_2=\Big\{\int_a^b\psi(x)\,dx\,;\;\psi\ge f\Big\},
$$
et $S=\sup E_1$, $I=\inf E_2$,
Il est clair que pour tout $\smash{A_1=\int_a^b\varphi(x)\,dx\in E_1}$ et tout 
$\smash{A_2=\int_a^b\psi(x)\,dx\in E_2}$ on a $A_1\le A_2$. L'hypothèse 
de la condition signifie que pour un choix adéquat de $\varphi,\,\psi$ on a
$A_2-A_1\le\varepsilon$. Ceci entraîne bien $S=\sup E_1=I=\inf E_2$.
Comme toute fonction en escalier est intégrable 
avec des jauges constantes (cf.\ exemple 2.8), il~existe 
$\delta_1>0$, $\delta_2>0$ tels que
$$
\eqalign{
&\forall D=\{([a_j,a_{j+1}],x_j)\},\qquad 
h_j\le \delta_1~\hbox{pour tout $j$} 
\Rightarrow |S_D(\varphi)-A_1|\le\varepsilon,\cr
&\forall D=\{([a_j,a_{j+1}],x_j)\},\qquad 
h_j\le \delta_2~\hbox{pour tout $j$} 
\Rightarrow |S_D(\psi)-A_2|\le\varepsilon.\cr
}
$$
Or nous avons $A_1\le S=I\le A_2$ et $A_2-A_1\le\varepsilon$.
Prenons une subdivision pointée $D=([a_j,a_{j+1}],x_j)$ vérifiant
$h_j\le\delta=\min(\delta_1,\delta_2)$. Nous obtenons dans ces
conditions $S_D(\varphi)\le S_D(f)\le S_D(\psi)$, donc
$$
S_D(f)\le S_D(\psi)\le A_2+\varepsilon\le I+2\varepsilon,\qquad
S_D(f)\ge S_D(\varphi)\ge A_1-\varepsilon\ge S-2\varepsilon.
$$
Par suite en posant $A=S=I$ il vient $|S_D(f)-A|\le 2\varepsilon$.
La suffisance du critère d'intégrabilité est démontrée.\qed
\medskip

{\bf (7.4)* Complément.}
{\it Le critère 7.3 est en fait une condition
nécessaire et suffisante pour que $f$ soit intégrable au sens de
Riemann sur~$[a,b]$.}

{\it  Démonstration.} Pour voir la nécessité de la condition, 
supposons $f:[a,b]\to\bR$ Riemann-intégrable et
soient $\varepsilon>0$ et $\delta>0$ satisfaisant la définition
2.1. Considérons une subdivision pointée $\delta$-fine
$D=\{([a_j,a_{j+1}],x_j)\}$ quelconque. En faisant varier
indépendamment chaque $x_j$ dans l'intervalle $[a_j,a_{j+1}]$, on
trouve
$$
\eqalign{
&\sup_{\{x_j\}}S_D(f)=
\sup_{\{x_j\}}\sum_{j=0}^{N-1}f(x_j)(a_{j+1}-a_j)=\sum_{j=0}^{N-1}M_j
(a_{j+1}-a_j),\cr
&\inf_{\{x_j\}}S_D(f)=
\inf_{\{x_j\}}\sum_{j=0}^{N-1}f(x_j)(a_{j+1}-a_j)=\sum_{j=0}^{N-1}m_j
(a_{j+1}-a_j)\cr}
$$
où $M_j=\sup_{x\in[a_j,a_{j+1}]}f(x)$, $m_j=\inf_{x\in[a_j,a_{j+1}]}f(x)$.
Puisque \hbox{$A-\varepsilon\le S_D(f)\le A+\varepsilon$}, on voit en passant
au sup et à l'inf que
$$
A-\varepsilon\le\sum_{j=0}^{N-1}m_j(a_{j+1}-a_j)\le
\sum_{j=0}^{N-1}M_j(a_{j+1}-a_j)\le A+\varepsilon.
$$
Ceci entraîne en particulier qu'aucune des bornes $M_j$ ne peut être 
égale à $+\infty$ et qu'aucune des bornes $m_j$ ne peut être égale à
$-\infty$, et par conséquent que $f$ est bornée. Si on définit les
fonctions en escalier $\varphi,\,\psi$ par
$$
\varphi(x)=m_j,\quad
\psi(x)=M_j\quad\hbox{si $x\in{}]a_j,a_{j+1}[$}, \qquad
\varphi(a_j)=\psi(a_j)=f(a_j),
$$
on obtient un encadrement $\varphi\le f\le\psi$ tel que
$$
\int_a^b\psi(x)\,dx-\int_a^b\varphi(x)\,dx\le 2\varepsilon,
$$
et on voit que la condition du critère 7.3 est bien satisfaite.\qed
\medskip

Une application directe de 7.3 est la preuve de l'intégrabilité
des fonctions monotones ou continues (dans la suite de ce paragraphe,
tous les résultats concerneront donc l'intégrabilité au sens de
Riemann.)
\medskip

{\bf (7.5) Théorème.} {\it Toute fonction $f:[a,b]\to\bR$ monotone est 
intégrable au sens de Riemann sur~$[a,b]$.}

{\it Démonstration.} Supposons par exemple $f$ croissante et soit
$a=u_1<\ldots <u_p=b$ une subdivision $\delta$-fine de $[a,b]$, où
$\delta>0$ est une constante. De manière évidente,
on définit un encadrement $\varphi\le f\le\psi$ de $f$ par des fonctions 
en escalier en posant
$$
\varphi(x)=f(u_j)~~\hbox{sur $]u_j,u_{j+1}[$},\qquad
\psi(x)=f(u_{j+1})~~\hbox{sur $]u_j,u_{j+1}[$}
$$
(et $\varphi(u_j)=\psi(u_j)=f(u_j)$ comme déjà convenu). Ceci donne
$$
\eqalign{
\int_a^b\psi(x)\,dx-\int_a^b\varphi(x)\,dx
&=\sum_{0\le j\le N-1}\big(f(u_{j+1})-f(u_j)\big)(u_{j+1}-u_j)\cr
&\le\delta\sum_{0\le j\le N-1}\big(f(u_{j+1})-f(u_j)\big)=
\delta\big(f(b)-f(a)\big).\cr}
$$
On voit ainsi que la condition 7.3 est vérifiée en prenant
$\delta$ assez petit.\qed
\medskip

{\bf (7.6) Théorème} {\it Toute fonction $f:[a,b]\to\bR$ continue est 
intégrable au sens de Riemann sur~$[a,b]$.}

{\it Démonstration.} Soit $\varepsilon>0$. La continuité de $f$ en tout 
point $x\in[a,b]$ implique l'existence d'un réel $\delta(x)>0$ tel que
$$
\forall x'\in[a,b],~~x'\in[x-\delta(x),x+\delta(x)]
\Rightarrow|f(x')-f(x)|\le\varepsilon.
$$
Soit $D=([a_j,a_{j+1}],x_j)_{0\le j<N}$ une subdivision pointée 
$\delta$-fine. En prenant $x=x_j$ et en faisant parcourir à $x'$
l'intervalle $[a_j,a_{j+1}]\subset[x_j-\delta(x_j),x_j+\delta(x_j)]$,
on déduit de la majoration $|f(x')-f(x_j)|\le\varepsilon$ que
les bornes inf et sup
$$
m_j=\inf_{x'\in[a_j,a_{j+1}]} f(x'),\quad
M_j=\sup_{x'\in[a_j,a_{j+1}]} f(x')
$$
sont comprises entre $f(x_j)-\varepsilon$ et $f(x_j)+\varepsilon$, par 
conséquent $M_j-m_j\le 2\varepsilon$. On obtient ainsi un encadrement
$\varphi\le f\le\psi$ de $f$ par des
fonctions en escalier $\varphi,\,\psi$ telles que
$$
\varphi(x)=m_j,\quad
\psi(x)=M_j\quad\hbox{si $x\in{}]a_j,a_{j+1}[$}, \qquad
\varphi(a_j)=\psi(a_j)=f(a_j),
$$
et de plus
$$
\eqalign{
\int_a^b\psi(x)\,dx-\int_a^b\varphi(x)\,dx&=\sum_{0\le j\le N-1}
(M_j-m_j)(a_{j+1}-a_j)\cr
&\le 2\varepsilon\sum_{0\le j\le N-1}a_{j+1}-a_j=2\varepsilon(b-a).\cr}
$$
Ceci montre que le critère 7.3 est satisfait, donc $f$ est
intégrable.\note{12}{On remarquera que dans cette preuve
l'utilisation explicite de la propriété de continuité uniforme
de la fonction $f$ n'a pas été nécessaire, ce qui est une
simplification appréciable susceptible de rendre la preuve abordable
dès la classe terminale [$\,$avec des vitamines tout de même$\,$!$\,$].}
\qed
\bigskip

\vbox{%
{\bf (7.7) Théorème.} {\it Toute fonction continue $f:[a,b]\to\bR$ admet
une primitive F, donnée par 
$$
\boxed{16}{
F(x)=\int_a^xf(t)\,dt,\qquad x\in[a,b].}
$$
Les autres primitives sont les fonctions de la forme $F_1(x)=F(x)+C$
où $C$ est une constante.}}

{\it Démonstration.} Nous savons que l'intégrale donnant $F(x)$ existe
par le Théorème~7.6. La relation de Chasles donne 
$$
F(x+h)-F(x)=\int_x^{x+h}f(t)\,dt\quad\Rightarrow\quad
{F(x+h)-F(x)\over h}={1\over h}\int_x^{x+h}f(t)\,dt.
$$
Pour tout $\varepsilon>0$, l'hypothèse de continuité dit que
$f(x)-\varepsilon\le f(t)\le f(x)+\varepsilon$ pour $|t-x|\le\delta(x)$, 
on a donc
$$
f(x)-\varepsilon={1\over h}\int_x^{x+h}(f(x)-\varepsilon)\,dt\le
{F(x+h)-F(x)\over h}\le 
{1\over h}\int_x^{x+h}(f(x)+\varepsilon)\,dt=f(x)+\varepsilon
$$
pour $|h|\le\delta(x)$, ce qui signifie que 
$$
F'(x)=\lim_{h\to 0}{F(x+h)-F(x)\over h}=f(x).
$$
Si on a une autre primitive $F_1$, il vient $(F_1-F)'=f'-f'=0$, donc 
$F_1-F=C$ constante.\qed
\medskip

{\bf (7.8) Proposition.} {\it 
{\parindent=6.5mm
\item{\rm (a)} Si $f:[a,b]\to\bR$ est une fonction continue positive ou 
nulle, on a $\int_a^b f(x)=0$ si et seulement si $f=0$.
\item{\rm (b)} Si $f,\,g:[a,b]\to\bR$ sont continues et $f\le g$, on a
$\int_a^bf(x)\,dx<\int_a^bg(x)\,dx$ dès que $f$ et $g$ se sont pas
égales.\vskip0pt
}}

{\it Démonstration.} (a) Si $f$ n'est pas nulle, il existe un point 
$x_0\in[a,b]$ tel que $f(x_0)>0$, et on pose alors $\varepsilon=f(x_0)/2$. 
La continuité de $f$ en $x_0$ implique qu'il existe un intervalle
$[x_0,x_0+\eta]$ (ou $[x_0-\eta,x_0]$, si $x_0=b$) sur lequel 
$f(x)-f(x_0)|\le\varepsilon$. On voit donc qu'il existe un sous-intervalle
$[c,d]$ de de $[a,b]$ de longueur $d-c=\eta>0$ sur lequel 
$f(x)\ge f(x_0)-\varepsilon\ge\varepsilon$. Par suite
$\int_a^bf(x)\,dx\ge\int_c^df(x)\,dx\ge(d-c)\,\varepsilon>0$.

(b) Si $f\le g$ et $f\ne g$, alors $h=g-f\ge 0$ n'est pas nulle, donc
$\int_a^bh(x)\,dx>0$ d'après~(a).\qed
\medskip

{\bf (7.9) Formule de la moyenne.} {\it Soit $f:[a,b]\to\bR$ une fonction 
continue. Alors il existe un point $c\in{}]a,b[$ tel que la 
«\?valeur moyenne de $f$ sur $[a,b]$\?» soit égale à $f(c)~:$
$$
\boxed{16}{
{1\over b-a}\int_a^bf(x)\,dx=f(c).}
$$
}

{\it Démonstration.} Soit $m=\min_{[a,b]}f$, $M=\max_{[a,b]}f$. 
Supposons d'abord $f$ non cons\-tante. D'après
la proposition 7.8~(b) appliquée aux inégalités $m\le f\le M$, 
nous avons 
$$
m(b-a)<\int_a^bf(x)\,dx<M(b-a),\quad\hbox{soit}\quad
m<{1\over b-a}\int_a^bf(x)\,dx<M.
$$
La formule de la moyenne est donc une conséquence du théorème des valeurs 
intermédiaires, puisque $f(]a,b[)$ est un intervalle qui
contient l'intervalle $]m,M[$. Si $f$ est égale à une constante $C$, 
le résultat est évident, les deux membres de la formule étant égaux
à $C$ quel que le soit le choix de $c\in{}]a,b[$.\qed
\medskip

{\bf (7.10) Une généralisation.} {\it On dit qu'une fonction 
$f:[a,b]\to\bR$ est continue $($resp.\ monotone$)$ par morceaux s'il existe
une subdivision
$$a=\alpha_0<\alpha_1<\alpha_2<\ldots<\alpha_{N-1}<\alpha_N=b$$ telle
que $f$ soit continue $($resp. monotone$)$ sur chaque intervalle
$]\alpha_j,\alpha_{j+1}[$ et possède des limites à droite et à
gauche finies en chaque point $\alpha_j$ tel que \hbox{$j<N$}
$($resp.\ \hbox{$j>0)$}. Toute fonction continue ou monotone par morceaux est
inté\-grable au sens de Riemann.}

{\it Démonstration.} En effet, la restriction 
$f_{|[\alpha_j,\alpha_{j+1}]}$ diffère d'une fonction continue 
(resp.\ monotone) par une fonction en escalier nulle sur 
$]\alpha_j,\alpha_{j+1}[$ (et prenant des valeurs adéquates en
$\alpha_j$ et $\alpha_{j+1}$). Par conséquent
$f_{|[\alpha_j,\alpha_{j+1}]}$ est intégrable au sens de Riemann,
et l'inté\-grabilité de $f$ sur $[a,b]$ résulte de la
relation de Chasles.\qed
\bigskip

Nous démontrons maintenant une généralisation du théorème
fondamental 4.1. Observons d'abord que comme une fonction nulle sauf
sur un ensemble fini est d'intégrale nulle (remarque 3.2), on peut
envisager d'intégrer des fonctions $f$ qui sont seulement définies
sur le complémentaire $[a,b]\ssm E$ d'un ensemble fini $E$~: on se
ramène au cas d'une fonction partout définie en étendant $f$
arbitrairement sur $[a,b]$, par exemple en posant $\tilde f(x)=0$ sur
$E$. L'intégrale ainsi calculée est indépendante du prolongement
$\tilde f$ choisi. 
\medskip

{\bf (7.11) Théorème.} {\it Soit $f:[a,b]\to\bR$ une fonction continue.
On suppose qu'il existe un ensemble fini $E=\{u_i\,;\;1\le i\le p\}$
tel que $f$ soit dérivable sur $[a,b]\ssm E$. Alors $f'$ $($étendue
arbitrairement aux points $u_i)$ est HK-intégrable sur
$[a,b]$ et on a
$$
\boxed{16}{
\int_a^bf'(x)\,dx = f(b)-f(a).}
$$}

{\it Démonstration.${}^*$} Supposons pour simplifier $f'$ définie par
$f'(u_i)=0$ aux points où $f$ n'est pas dérivable. On reprend la
démonstration du théorème 4.1. La dérivabilité de $f$ sur
$[a,b]\ssm E$ implique l'existence d'une fonction $\delta:[a,b]\ssm
E\to{}]0,+\infty[$ telle que
$$
y\in[a,b],\quad y\in[x-\delta(x),x+\delta(x)]\Rightarrow 
\big|f(y)-f(x)-(y-x)f'(x)\big|\le\varepsilon|y-x|
$$
pour tout $x\in[a,b]\ssm E$, ce qui donne
$$
\big|f(a_{j+1})-f(a_j)-(a_{j+1}-a_j)f'(x_j)\big|
\le\varepsilon|a_{j+1}-a_j|
$$
pour toute subdivision pointée $D=\{([a_j,a_{j+1}],x_j)\}$ $\delta$-fine, 
lorsque $x_j\in[a,b]\ssm E$. D'autre part, si $x_j=u_i\in E$, la continuité
de $f$ au point $u_i$ entraîne l'existence de $\delta_i>0$ tel que tout
point $x\in[u_i-\delta_i,u_i+\delta_i]$ satisfasse
$|f(x)-f(u_i)|\le \varepsilon\,2^{-i}$. On pose alors $\delta(u_i)=\delta_i$. 
Dans ce cas il vient $|f(a_{j+1})-f(a_j)|\le 2\varepsilon\,2^{-i}$ si 
$x_j=u_i$, ce qui donne
$$
\big|f(a_{j+1})-f(a_j)-(a_{j+1}-a_j)f'(x_j)\big|
\le 2\varepsilon\,2^{-i}.
$$
En sommant toutes ces inégalités, il vient
$$
\big|f(b)-f(a)-S_D(f')\big|\le\varepsilon(b-a)+2\varepsilon,
$$
(car $\sum_{1\le i\le p}2\varepsilon\,2^{-i}\le 2\varepsilon$), ce qui 
démontre le théorème.\qed
\medskip

{\bf (7.12)* Remarque.} D'après l'exercice 9.22 et la preuve ci-dessus, 
on voit que le théorème 7.11 est en fait encore vrai avec un ensemble 
$E=\{u_i\}_{i\in\bN}$ dénombrable.
\medskip

{\bf (7.13) Corollaire.} {\it Si $f:{}]a,b[{}\to\bR$ admet une primitive
$F$ sur $]a,b[$, et si cette primitive $F$ admet une limite à droite
$F(a+0)$ en $a$ et une limite à gauche $F(b-0)$ en $b$, alors $f$
est HK-intégrable sur $[a,b]$ $($si $f$ n'est pas a priori définie
en $a$ et $b$, on peut lui attribuer des valeurs $f(a),\,f(b)\in\bR$ 
arbitraires$)$, et on a
$$
\boxed{16}{
\int_a^b f(x)\,dx = F(b-0)-F(a+0)=\lim_{x\to b-0}F(x)-\lim_{x\to a+0}F(x).}
$$
}

{\it Démonstration.} Il suffit en effet de prolonger $F$ par
continuité sur $[a,b]$ en posant $F(a)=\lim_{x\to a+0}F(x)$ et 
$F(b)=\lim_{x\to b-0}F(x)$, puis d'appliquer le théorème~7.11
à sa dérivée $F'$ qui est définie sur $]a,b[{}=[a,b]\ssm E$ avec 
$E=\{a,b\}$.\qed
\medskip

Un exemple typique d'application du corollaire 7.13 est celui de la fonction
$$
f(x)={1\over\sqrt{1-x^2}}\qquad\hbox{sur l'intervalle $]-1,1[$}.
$$
Dans ce cas, on a en effet une primitive $F(x)=\arcsin(x)$ qui se prolonge
en une fonction continue sur $[-1,1]$. On obtient par conséquent
$$
\int_{-1}^1{1\over\sqrt{1-x^2}}\,dx=\arcsin(1)-\arcsin(-1)=\pi.
$$
Plus généralement, le corollaire 7.13 nous amène à la définition des
«\?intégrales im\-propres\?».
\medskip

{\bf (7.14) Intégrales «\?impropres\?».} {\it Soit 
$I=[a,b[{}\subset\bR$ un intervalle semi-ouvert,
où \hbox{$b\in\bR\cup\{+\infty\}$}, et soit $f:[a,b[{}\to\bR$ une fonction
intégrable $($par exemple continue ou monotone par morceaux$)$ sur tout 
intervalle $[a,\beta]\subset[a,b[$. On dit que
l'intégrale $\int_a^bf(x)\,dx$ est convergente au point $b$ si la limite
$$
A=\lim_{\beta\to b_-}\int_a^\beta f(x)\,dx
$$
existe dans $\bR$ $($en particulier finie$)$, et on pose alors 
$\int_a^bf(x)\,dx=A$.\smallskip
On donne une définition analogue dans le cas d'un intervalle 
semi-ouvert $]a,b]$,\break \hbox{$a\in\bR\cup\{-\infty\}$}, en considérant
la limite $\smash{\lim_{\alpha\to a_+}\int_\alpha^bf(x)\,dx}$ avec 
$[\alpha,b]\subset{}]a,b]$, et on dit qu'on a
convergence sur un intervalle ouvert $]a,b[$ si les intégrales sur
$]a,c]$ et $[c,b[$ convergent pour tout point intermédiaire
$c\in{}]a,b[$.}
\medskip

{\bf (7.15) Exemples.} On vérifiera que les intégrales
$$
\int_0^1{1\over x^a}\,dx = {1\over 1-a},\qquad
\int_1^{+\infty}{1\over x^b}\,dx = {1\over b-1}
$$
convergent respectivement pour $a<1$ et $b>1$, et que
$$
\int_0^{+\infty}e^{-cx}\,dx = {1\over c}
$$
converge pour tout $c>0$. En utilisant le calcul de la
primitive de $x^n e^{-x}$ donné au point (5.1$\,$a), 
on obtient également le résultat classique
$$
\int_0^{+\infty}x^ne^{-x}\,dx=n!\;.
$$

{\bf (7.16)** Convergence absolue.} {\it Soit $f:[a,b[{}\to\bR$ une fonction
HK-intégrable sur tout intervalle fermé borné $[a,\beta]$.
On dit que l'intégrale $\smash{\int_a^bf(x)\,dx}$ est absolument convergente 
si de plus $|f|$ est HK-intégrable sur chaque intervalle 
$[a,\beta]\subset[a,b[$ et si la limite
$$
\lim_{\beta\to b_-}\int_a^\beta |f(x)|\,dx
$$
existe dans $\bR$ $($donc en particulier si elle est finie$)$.} 
\medskip

On donne une
définition analogue dans le cas d'un intervalle semi-ouvert $]a,b]$,\break
\hbox{$a\in\bR\cup\{-\infty\}$}, en considérant la limite 
$\smash{\lim_{\alpha\to a_+}\int_\alpha^bf(x)\,dx}$ avec 
$[\alpha,b]\subset{}]a,b]$, et on dit qu'on a
convergence sur un intervalle ouvert $]a,b[$ si les intégrales sur
$]a,c]$ et $[c,b[$ convergent pour tout point intermédiaire
$c\in{}]a,b[$.\medskip 

Le critère de Cauchy${}^*$ permet de voir qu'il y a convergence 
(resp.\ convergence absolue) de l'intégrale sur $[a,b[$ si et seulement
si pour tout $\varepsilon>0$ il existe $\beta_\varepsilon<b$ tel que pour
tous $\beta,\gamma\in [\beta_\varepsilon,b[$, $\beta<\gamma$, on ait
$$
\Big|\int_\beta^\gamma f(x)\,dx\Big|\le\varepsilon,
\qquad\hbox{resp.}\quad\int_\beta^\gamma |f(x)|\,dx\le\varepsilon.
$$
Comme $\big|\int_\beta^\gamma f(x)\,dx\big|\le
\int_\beta^\gamma |f(x)|\,dx$, il est clair que la convergence absolue
implique la convergence.
\bigskip

\section{8. Convergence uniforme, continuité et dérivabilité
d'intégrales en fonction de paramètres**}
\sectionrunning{8. Convergence uniforme, continuité et dérivabilité
en fonction de paramètres}

Soit $f_n:[a,b]\to\bR$ une suite de fonctions réelles. On dit que la
suite $(f_n)$ converge uniformément vers une limite $f:[a,b]\to\bR$, 
si la distance uniforme de $f_n$ à $f$ tend vers~$0$ c'est-à-dire si
$$d(f_n,f)=\sup_{x\in[a,b]}|f_n(x)-f(x)|\to 0.$$

{\bf (8.1) Théorème de convergence uniforme.} {\it Soit
$f_n:[a,b]\to\bR$ une suite de fonctions réelles convergeant
uniformément vers une limite $f$.  Si les fonctions $f_n$ sont
Riemann-intégrables $($resp.\ HK-intégrables$)$, alors $f$ est
Rie\-mann-intégrable $($resp.\ HK-intégrable$)$ et
$$
\lim_{n\to+\infty}\int_a^bf_n(x)\,dx=\int_a^bf(x)\,dx.
$$
}

{\it Démonstration.} Posons $A_n=\smash{\int_a^b
f_n(x)\,dx}$. Soit $\varepsilon>0$ et $n_0$ tels que
$|f_n-f|\le\varepsilon$ pour $n\ge n_0$. Nous avons $|f_p-f_q|\le
2\varepsilon$ pour $p,q\ge n_0$, d'où $|A_p-A_q|\le2\varepsilon(b-a)$. 
La suite $(A_n)$ est donc une
suite de Cauchy, par conséquent la limite $A=\lim_{n\to+\infty}A_n$
existe. De plus, il existe une jauge $\delta$ (resp.\ une jauge
constante dans le cas de l'intégrabilité au sens de Riemann) telle
que pour toute subdivision pointée $D$ de pas $h_j\le\delta(x_j)$ on
ait $|S_D(f_{n_0})-A_{n_0}|\le\varepsilon$.  Il vient à la limite
$|A-A_{n_0}|\le 2\varepsilon(b-a)$ tandis que
$|S_D(f)-S_D(f_{n_0})|\le\sum|f(x_j)-f_{n_0}(x_j)|\,h_j\le\varepsilon(b-a)$.
En mettant bout à bout ces inégalités il vient
$$
|S_D(f)-A|\le\varepsilon+3\varepsilon(b-a),
$$
donc $f$ est bien intégrable sur $[a,b]$ d'intégrale $A=\lim A_n$.\qed
\medskip

{\bf (8.2) Remarque.} Pour obtenir l'intégrabilité au sens
de Henstock-Kurzweil de la limite $f=\lim f_n$, il suffirait
d'avoir une estimation de la forme $|f_n-f|\le\varepsilon_ng$ avec
$g\ge 0$ HK-intégrable (non nécessairement bornée) et 
$\varepsilon_n\to 0$.
Nous obtiendrons de toutes façons des théorèmes de convergence
beaucoup meilleurs encore dans ce cas, cf.~chapitre III.
\medskip

Rappelons qu'une fonction $f:I\to\bR$ définie sur un intervalle
$I$ est dite {\it réglée} si elle admet une limite à droite et 
à gauche en tout point de l'intérieur $I^\circ$, ainsi qu'une limite
à droite en $a=\inf I$ si $a\in I$ et à gauche en $b=\sup I$ si $b\in I$.
\medskip

{\bf (8.3) Lemme.} {\it Toute fonction réglée sur un intervalle
fermé borné $[a,b]$ est limite uniforme de
fonctions en escalier.}
\medskip

{\bf (8.4) Corollaire.} {\it Toute fonction réglée sur sur un intervalle
fermé borné $[a,b]$ y est Riemann-intégrable.} 

{\it Démonstration du lemme et de son corollaire.} Soit $\varepsilon>0$. 
Pour tout $x\in[a,b]$, il existe
$\delta(x)>0$ et des constantes $c^+=\lim_{\xi\to x+0}f(\xi)$, 
$c^-=\lim_{\xi\to x-0}f(\xi)$ telles que $|f(x)-c^-|\le\varepsilon$ sur
$[x-\delta(x),x]\cap[a,b]$ et $|f(x)-c^+|\le\varepsilon$ sur
$[x,x+\delta(x)]\cap[a,b]$. D'après le lemme I.2.6, on peut trouver une
subdivision pointée $D=([a_j,a_{j+1}],x_j)$ $\delta$-fine. Ceci nous
permet de définir une fonction en escalier $\varphi$ en posant
$$
\eqalign{
&\varphi(x_j)=f(x_j),\quad \varphi(a_j)=f(a_j),\cr
&\varphi_{|]a_j,x_j[}=c^-_j=\lim_{\xi\to x_j-0}f(\xi),\quad
\varphi_{|]x_j,a_{j+1}[}=c^+_j=\lim_{\xi\to x_j+0}f(\xi).\cr}
$$ 
Par construction nous avons $|f-\varphi|\le\varepsilon$ sur $[a,b]$.
Il en résulte que $f$ est Riemann-intégrable comme limite uniforme
de fonctions en escalier.\qed
\medskip

On va maintenant tirer du théorème de convergence uniforme
les propriétés usuelles de continuité et de dérivabilité sous le 
signe somme des intégrales dépendant de para\-mètres. Des résultats 
beaucoup plus forts sont vrais, mais on aura besoin pour cela de théorèmes
de convergence plus subtils que le théorème 8.1 (cf.\ Chapitre
III, section 5).
\medskip

{\bf (8.5) Lemme.} {\it Soit $T\subset\bR^d$ une partie quelconque et 
$f:[a,b]\times T\to\bR$, $(x,t)\mapsto f(x,t)$
une application continue. Alors, si $t_0\in T$, la famille de fonctions
$f_t:x\mapsto f(x,t)$ converge uniformément vers la fonction
$f_{t_0}:x\mapsto f(x,t_0)$ quand $T\ni t$ tend vers $t_0$. Autrement dit,
pour tout $\varepsilon>0$, il existe un voisinage $V$ de $t_0$ tel que 
pour $t\in T\cap V$, on ait
$|f(x,t)-f(x,t_0)|\le\varepsilon$ pour tout $x\in[a,b]$.}

{\it Démonstration.} Pour tout $x_0\in[a,b]$, l'hypothèse de continuité
au point $(x_0,t_0)$ implique qu'il existe un voisinage $V_{x_0,t_0}$ de
$t_0$ (dépendant de $x_0$) et un voisinage
$$
U_{(x_0,t_0)}=
[x_0-\delta(x_0),x_0+\delta(x_0)]\times V_{x_0,t_0}\quad\hbox{de $(x_0,t_0)$}
$$
tel que $(x,t)\in U_{(x_0,t_0)}\cap([a,b]\times T)$ implique
$|f(x,t)-f(x_0,t_0)|\le\varepsilon/2$. En appliquant ceci en particulier
pour $t=t_0$ et en faisant la différence, on voit que
que pour tout $t\in T\cap V_{x_0,t_0}$ et
tout $x\in[x_0-\delta(x_0),x_0+\delta(x_0)]$ on a
$|f(x,t)-f(x,t_0)|\le\varepsilon$. D'après le lemme~I.2.6, il existe une
subdivision pointée $D=([a_i,a_{i+1}],x_i)$ de $[a,b]$ qui est 
$\delta$-fine. Par conséquent
$[a_i,a_{i+1}]\subset[x_i-\delta(x_i),x_i+\delta(x_i)]$, et
en prenant $t\in V=\bigcap_i V_{x_i,t_0}$ on voit que
la conclusion du lemme est vérifiée.
\qed
\medskip

De là, on déduit aussitôt le théorème de continuité des
intégrales dépendant de para\-mètres.

{\bf (8.6) Continuité sous le signe somme.} {\it Soit $T\subset\bR^d$ 
une partie quelconque et $f:[a,b]\times T\to\bR$, $(x,t)\mapsto f(x,t)$
une application continue. Alors l'application 
$$F(t)=\int_a^b f(x,t)\,dx$$ 
est continue sur~$T$.
}

{\it Démonstration.} Avec les notations du lemme 8.5, on trouve
$$
|F(t)-F(t_0)|\le\int_a^b\big|f(x,t)-f(x,t_0)\big|\,dx\le
(b-a)\varepsilon
$$
pour $t\in T\cap V$, ce qui prouve la continuité de $F$ au point~$t_0$.\qed
\medskip

{\bf (8.7) Dérivation sous le signe somme.}
{\it Soit $T$ un intervalle de la droite réelle et $f: [a,b]\times T\to\bR$,
$(x,t)\mapsto f(x,t)$ une fonction telle que
{\parindent=6.5mm
\item{\rm(a)} $f$ est continue sur $[a,b]\times T\;;$ 
\item{\rm(b)} $f$ admet en tout point une dérivée partielle
${\partial f\over\partial t}(x,t)$ qui est elle-même continue
sur~$[a,b]\times T$.\vskip0pt}
Alors l'application $F(t)=\int_a^bf(x,t)\,dx$ est de classe $C^1$ sur $T$
et pour tout $t_0\in T$ on a
$$
\boxed{16}{
F'(t_0)=\int_a^b {\partial f\over\partial t}(x,t_0)\,dx}.
$$
}

{\it Démonstration.} Soit $t\in T$. En appliquant le théorème des 
accroissements finis à $t\mapsto f(x,t)$ sur l'intervalle $[t_0,t]$, 
on voit que
$$
{F(t)-F(t_0)\over t-t_0}=
\int_a^b {f(x,t)-f(x,t_0)\over t-t_0}\,dx=
\int_a^b {\partial f\over\partial t}(x,c_{t,x})\,dx
$$
pour un certain point $c=c_{t,x}\in{}]t_0,t[$. Soit $\varepsilon>0$. En 
appliquant le lemme 8.5 à la fonction continue 
$g(x,t)={\partial f\over\partial t}(x,t)$, on voit qu'il existe un
voisinage $V={}]t_0-\eta,t_0+\eta[$ de $t_0$ tel que 
$|{\partial f\over\partial t}(x,t)-
{\partial f\over\partial t}(x,t_0)|\le \varepsilon$ pour
tout $x\in[a,b]$ et tout $t\in V$. Sous cette hypothèse on
a également $c(x,t)\in{}]t_0,t[{}\subset V$, donc
$|{\partial f\over\partial t}(x,c_{t,x})-
{\partial f\over\partial t}(x,t_0)|\le \varepsilon$ et par suite
$$
\bigg|{F(t)-F(t_0)\over t-t_0}-
\int_a^b {\partial f\over\partial t}(x,t_0)\,dx\bigg|
=\bigg|\int_a^b \Big(
{\partial f\over\partial t}(x,c_{t,x})
-{\partial f\over\partial t}(x,t_0))\Big)\,dx\bigg|\le (b-a)\varepsilon.
$$
On a donc bien $F'(t_0)=\int_a^b {\partial f\over\partial t}(x,t_0)\,dx$,
et cette relation montre que $F'$ est continue d'après le théorème~8.6.\qed
\medskip

Pour un paramètre $t=(t_1,\ldots, t_d)\in\bR^d$, nous avons le résultat
analogue suivant.
\medskip
{\bf (8.8) Différentiabilité sous le signe somme.}
{\it Soit $T\subset\bR^d$ une partie ouverte et
$f: [a,b]\times T\to\bR$, $(x,t)\mapsto f(x,t)$ une 
fonction telle que
{\parindent=6.5mm
\item{\rm(a)} $f$ est continue sur $[a,b]\times T\;;$
\item{\rm(b)} $f$ admet en tout point des dérivées partielles 
${\partial f\over\partial t_j}(x,t)$  qui sont elles-mêmes
continues sur $[a,b]\times T$.\vskip0pt}
Alors l'application $F(t)=\int_a^b f(x,t)\,dx$ est de classe $C^1$ sur $T$
et on a
$$
\boxed{16}{{\partial F\over\partial t_j}(t)=
\int_a^b {\partial f\over\partial t_j}(x,t)\,dx.}
$$
}

{\it Démonstration.} Il suffit en effet d'appliquer le théorème
de dérivation sous le signe somme séparément pour chaque
variable $t_j$ pour voir que les dérivées partielles
$\partial F/\partial t_j$ existent, et d'invoquer ensuite le théorème 
de continuité pour voir que ces dérivées partielles 
sont continues sur $T$.\qed
\medskip

Il est bon parfois de connaître également la formule de
différentiation sous le signe somme dans le cas où l'intégrale est
calculée sur des intervalles dépendant du paramètre.

\medskip
{\bf (8.9) Formule générale de dérivation sous le signe somme.}
{\it Soient $I\subset\bR$ et $T\subset\bR$ des intervalles. On considère
une intégrale de la forme
$$
F(t)=\int_{a(t)}^{b(t)} f(x,t)\,dx
$$
où $a,b:T\to I$ sont des fonctions de classe $C^1$
et $f: I\times T\to\bR$, $(x,t)\mapsto f(x,t)$ une 
fonction continue admettant une dérivée partielle 
${\partial f\over\partial t}$ continue sur $I\times T$.
Alors l'application $F$ est de classe $C^1$ sur $T$ et on a
$$
\boxed{16}{
F'(t)=\int_{a(t)}^{b(t)}{\partial f\over\partial t}(x,t)\,dx
+b'(t)f(b(t),t)-a'(t)f(a(t),t).}
$$}

{\it Démonstration.} On pose
$$
\Phi(t,u,v)=\int_u^v f(x,t)\,dx.
$$
Plaçons-nous sur un sous-intervalle fermé borné 
$T'=[t_1,t_2]\subset T$,
et soit 
$$
A=\min_{t\in T'}a(t)\in I,\qquad B=\max_{t\in T'}b(t)\in I.
$$
Nous avons $[A,B]\subset I$, donc les hypothèses des théorèmes 8.5 et 
8.6 sont satisfaites sur $[A,B]\times T'$. On voit par conséquent que
$\Phi$ admet des dérivées partielles
$$
{\partial\Phi\over\partial t}=\int_u^v {\partial f\over\partial t}(x,t)\,dx,
\qquad
{\partial\Phi\over\partial v}=f(v,t),
\qquad
{\partial\Phi\over\partial u}=-f(u,t)
$$
(pour cette dernière égalité, il suffit d'échanger les bornes $u$ et $v$).
De plus, ces trois dérivées partielles sont continues en les variables
$(t,u,v)$. Pour ${\partial\Phi\over\partial u}$ et 
${\partial\Phi\over\partial v}$ c'est clair par hypothèse, tandis que
pour ${\partial\Phi\over\partial t}$ cela résulte de l'estimation
$$
\Big|{\partial\Phi\over\partial t}(t,u,v)-
{\partial\Phi\over\partial t}(t_0,u_0,v_0)\Big|
\le
M(|u-u_0|+|v-v_0|)+\bigg|\int_{u_0}^{v_0}
\Big({\partial f\over\partial t}(x,t)-{\partial f\over\partial t}(x,t_0)\Big)
\,dx\bigg|
$$
dans laquelle $M$ est un majorant de $|{\partial f\over\partial t}|$ sur
la pavé $[A,B]\times T'$. On
déduit de tout cela que $\Phi(t,u,v)$ et $F(t)=\Phi(t,a(t),b(t))$ sont 
de classe $C^1$. De plus
$$
F'(t)={\partial \Phi\over\partial t}(t,a(t),b(t))+
{\partial \Phi\over\partial u}(t,a(t),b(t))\,a'(t)+
{\partial \Phi\over\partial v}(t,a(t),b(t))\,b'(t)
$$
ce qui donne la formule (8.9) attendue.\qed
\vfill\eject

\section{9. Vrai ou faux}\vskip-19pt\ \kern88pt\ 
\note{13}{Les questions et les exercices qui suivent
proviennent du polycopié de Bernard Ycart, proposé aux étudiants 
de L1 à l'Université de Grenoble I.}
\vskip8pt

{\bf 9.1.} On considère la fonction $f\,:\,x\mapsto x$ sur 
l'inter\-valle $I=[0,2]$.  Parmi les affirmations suivantes, lesquelles sont 
vraies, lesquelles sont fausses et pourquoi~?
{\parindent=6.5mm
\itemf
$\dsp{\sum_{i=1}^{2n} {i\over n}}$ 
est une somme de Riemann associée à
$f$ sur $I$.
\itemv
$\dsp{\sum_{i=1}^{2n} {i\over n^2}}$ 
est une somme de Riemann associée à
$f$ sur $I$.
\itemf
$\dsp{{2\over n}\sum_{i=1}^{n} {2i\over n^2}}$ 
est une somme de Riemann associée à
$f$ sur $I$.
\itemv
$\dsp{\sum_{i=1}^{n} {4i\over n^2}}$ 
est une somme de Riemann associée à
$f$ sur $I$.
\itemf
$\dsp{\sum_{i=1}^{2n} {i\over n^2}}$ 
tend vers $\dsp{{1\over 2}}$ quand $n$ tend
vers l'infini.
\itemv
$\dsp{\sum_{i=1}^{2n} {i\over n^2}}$ 
tend vers $2$ quand $n$ tend
vers l'infini.
}
\medskip

{\bf 9.2.}
Toutes les fonctions considérées sont supposées intégrables
sur l'inter\-valle considéré.
Parmi les affirmations suivantes, lesquelles sont 
vraies, lesquelles sont fausses et pourquoi~?

{\parindent=6.5mm
\itemv 
L'intégrale sur $[0,1]$ d'une fonction 
négative ou nulle est
négative ou nulle.
\itemf
L'intégrale d'une fonction paire sur $[0,1]$ est positive ou nulle.
\itemv
L'intégrale d'une fonction impaire sur $[-1,1]$ est nulle.
\itemf
L'intégrale sur $[0,1]$ d'une fonction minorée par $1$ 
est inférieure ou égale à $1$.
\itemf
L'intégrale sur $[-1,1]$ d'une fonction majorée par $1$
est inférieure ou égale à $1$.
\itemv
L'intégrale sur $[-1,1]$ d'une fonction majorée par $2$ 
est inférieure ou égale à $4$.
\itemv
Si une fonction $f$ est telle que pour tout $x\in[-1,1]$, 
$f(x)<x^3$, alors son intégrale sur $[-1,1]$ est strictement négative.
\itemv
Si l'intégrale d'une fonction $f$ continue 
sur $[0,1]$ vaut $y$, alors il existe
$x\in [0,1]$ tel que $f(x)=y$.
\itemf
Si l'intégrale d'une fonction $f$ sur $[-1,1]$ vaut $y$, alors il existe
$x\in [0,1]$ tel que $f(x)=2y$.
}
\medskip

{\bf 9.3.} Parmi les affirmations suivantes lesquelles sont 
vraies, lesquelles sont faus\-ses, et pourquoi~?
{\parindent=6.5mm
\itemf
Toute fonction intégrable sur $[a,b]$ est continue.
\itemv
Si une fonction est continue sur $[a,b]$, sauf en un point, alors $f$
admet une primitive.
\itemv
Toute fonction continue sur $[a,b]$ admet une primitive qui s'annule
en $b$.
\itemf
Toute primitive d'une fonction continue sur $[a,b]$ s'annule en un
point de $[a,b]$.
\itemv
Toute primitive d'une fonction continue sur $[a,b]$ est dérivable
sur $]a,b\,[$.
\itemf 
Toute primitive d'une fonction continue sur $]a,b\,[$ est dérivable
à droite en $a$.
} 
\medskip

{\bf 9.4.}
Parmi les affirmations suivantes lesquelles sont 
vraies, lesquelles sont faus\-ses, et pourquoi~?
{\parindent=6.5mm
\itemf
Toute primitive d'une fonction positive ou nulle est positive ou
nulle.
\itemv 
Toute primitive d'une fonction négative ou nulle est décroissante.
\itemf
Toute fonction continue est la primitive d'une fonction continue.
\itemf
Si $f$ est une fonction continue, alors $-\cos(f(x))$ est une
primitive de $\sin(f(x))$.
\itemf
Si $f$ est une fonction continûment dérivable et ne s'annulant pas,
$\ln(f(x))$ est une primitive de ${f'(x)\over f(x)}$.
\itemv
Si $f$ est une fonction continûment dérivable,
$\arctan(f(x))$ est une primitive de ${f'(x)\over 1+f^2(x)}$.
\itemf
Il existe des primitives de $(1-x^2)^{-1/2}$ définies sur
l'intervalle $[0,2]$.  
\itemv
Il existe des primitives de $(1-x^2/2)^{-1/2}$ définies sur
l'intervalle $[0,1]$.  
\itemv
Il existe des primitives de $|1-x^2|^{1/2}$ définies sur
l'intervalle $[-2,2]$.  
\itemf
Il existe des primitives de $|1-x^2|^{-1/2}$ définies sur
l'intervalle $[-2,2]$. 
}

\medskip
{\bf 9.5.} Parmi les égalités suivantes lesquelles sont 
vraies, lesquelles sont fausses, et pourquoi~? 
{\parindent=6.5mm
\itemv 
$\dsp{
\int_0^\pi x\sin(x)\,dx = 
-\int_0^\pi {x^2\over 2}\cos(x)\,dx\;.
}$
\itemf  
$\dsp{
\int_0^\pi x\sin(x)\,dx = 
\int_0^\pi \cos(x)\,dx\;.
}$
\itemv  
$\dsp{
\int_0^\pi x\sin(x)\,dx = 
\pi-\int_0^\pi \cos(x)\,dx\;.
}$
\itemf
$\dsp{
\int_0^\pi x\sin(x)\,dx = 
\pi-2\;.
}$
\itemv
$\dsp{
\int_0^\pi x\sin(x)\,dx = 
\pi\;.
}$
\itemv
$\dsp{
\int_0^\pi x\cos(x)\,dx = 
-2\;.
}$
\itemf
$\dsp{
\int_0^\pi x\sin(2x)\,dx = \Big[\sin(2x)\Big]_0^\pi 
-2\int_0^\pi \cos(2x)\,dx\;.
}$
\itemv
$\dsp{
\int_0^\pi x\cos(2x)\,dx = 
0\;.
}$
\itemv
$\dsp{
\int_0^\pi x\sin^2(x)\,dx = 
\int_0^\pi x\cos^2(x)\,dx\;.
}$
\itemf
$\dsp{
\int_0^\pi x\sin^2(x)\,dx = 
{\pi^2\over 2}\;.
}$
}
\medskip

{\bf 9.6.}
Parmi les égalités suivantes lesquelles sont 
vraies, lesquelles sont fausses, et pourquoi~? 
{\parindent=6.5mm
\itemf
$\dsp{
\int_0^{{\pi\over 2}} \sin(2x)\,dx = 
\int_0^{{\pi\over 2}} \sin(u)\,{du\over 2}\;.
}$
\itemf
$\dsp{
\int_0^{{\pi\over 2}} \sin(2x)\,dx = 
\int_0^{{\pi\over 4}} \sin(u)\,{du\over 2}\;.
}$
\itemv
$\dsp{
\int_0^{{\pi\over 2}} \sin(2x)\,dx = 
\int_0^{{\pi\over 2}} \sin(u)\,du\;.
}$
\itemv
$\dsp{
\int_0^{{\pi\over 8}} \sin(2x)\,dx = 
\int_0^{{\sqrt{2}\over 2}} {u\over 2\sqrt{1-u^2}}\,du\;.
}$
\itemf
$\dsp{
\int_{{\pi\over 4}}^{{\pi\over 2}} \sin(2x)\,dx = 
\int_{{1\over \pi}}^{{2\over \pi}} {\sin({1\over u})\over u^2}\,du\;.
}$
\itemv
$\dsp{
\int_{0}^{{\pi\over 2}} \sin(2x)\,dx = 
\int_{1}^{e^{\pi}} {\sin(\ln(u))\over 2u}\,du\;.
}$
}
\bigskip

\section{10. Exercices}

{\bf 10.1.} Calculer les intégrales suivantes.

(a)~~ $\dsp\int_0^1 (\sqrt{u}+7u)\,du$\kern30pt
(b)~~ $\dsp\int_0^2{u^3\over u^4+7}\,du$\kern30pt
(c)~~ $\dsp\int_0^{\sqind{3}\sqrt{\pi}}u^2\sin(u^3+\pi)\,du$\smallskip
(d)~~ $\dsp\int_0^1{u\over (u^2+1)^3}\,du$\kern32pt
(e)~~ $\dsp\int_0^1 {x\over x^2+1}\,dx$\kern30pt
(f)~~ $\dsp\int_0^{e-1}{\ln(x+1)\over x+1}\,dx$
\medskip

{\bf 10.2.} Calculer les intégrales suivantes par des changements
de variables judicieux.

(a)~~ $\dsp\int_0^7 {dz\over(z+7)^2+3}$\kern28pt
(b)~~ $\dsp\int_0^3 {dt\over 1-2t^2}$\kern32pt
(c)~~ $\dsp\int_0^1 {u^5\over u^{12}+1}\,du$\smallskip
(d)~~ $\dsp\int_1^2 (\sqrt{u}+1)\ln(\sqrt{u}+1)\,{du\over\sqrt{u}}$\kern30pt
(e)~~ $\dsp\int_a^b{dt\over\sqrt{(a+t)(b-t)}}$\smallskip
(f)~~ $\dsp\int_2^4{\sqrt{x^2-x}+1\over\sqrt{x^2-x}+3}\,dx$
\medskip

{\bf 10.3.} Calculer les primitives et intégrales suivantes en
utilisant une ou plusieurs inté\-grations par parties.

(a)~~ la primitive de $\ln(x)$ nulle en $0$\smallskip
(b)~~ la primitive de $\arctan(x)$ nulle en $\pi/4$\smallskip
(c)~~ $\dsp\int_0^e \ln(x^3+1)\,dx$\kern20pt
(d)~~ $\dsp\int_0^1 x\ln(x^2 + 1)\,dx$\smallskip
(e)~~ $\dsp\int_0^5 we^{2w+1}\,dw$\kern20pt
(f)~~ $\dsp\int_0^\pi x^2\cos(x)\,dx$
\medskip

{\bf 10.4.} Étudier les fonctions suivantes.

(a)~~ $\dsp f(x)=\int_7^x\arctan(z+1)\,dz$\kern20pt
(b)~~ $\dsp g(x)=\int_{-x^2}^2 {2v+3\over v+1}\,dv$\smallskip
(c)~~ $\dsp h(x)=\int_x^{2x}\ln(u)\,du$
\medskip

{\bf 10.5.} Pour chacune des fonctions suivantes, donnez son domaine de 
définition puis ses éventuelles primitives (on utilisera des changements de
variables adéquats).

(a)~~ $\dsp x\mapsto{(\ln x)^p\over x}$ $(p\in\bZ)$\kern20pt
(b)~~ $\dsp x\mapsto {x\over\sqrt{1-x^4}}$\kern20pt
(c)~~ $\dsp x\mapsto {\cos \ln x\over x}$\smallskip
(d)~~ $\dsp x\mapsto {x\over\sqrt{x^4-1}}$\kern20pt
(e)~~ $\dsp x\mapsto {e^x\over 1+e^{2x}}$
\medskip

{\bf 10.6.} Pour chacune des fonctions suivantes, donnez son domaine de 
définition puis ses éventuelles primitives (on utilisera des intégrations
par parties adéquates).

(a)~~ $x\mapsto \arcsin x$\kern30pt
(b)~~ $x\mapsto x^p\ln x$ $(p\in\bN)$\smallskip
(c)~~ $\dsp x\mapsto {x\over \cosh^2x}$\kern30pt
(d)~~ $x\mapsto x\tan^2x$
\medskip

{\bf 10.7.} Calculer les primitives de chacunes des fractions rationnelles
suivantes.

(a)~~ $\dsp x\mapsto {1\over 8-x^3}$\kern30pt
(b)~~ $\dsp x\mapsto {1\over 1+x^4}$\kern30pt
(c)~~ $\dsp x\mapsto {1\over 8-x^3}$\smallskip
(d)~~ $\dsp x\mapsto {x^5+2\over x^5-x}$\kern30pt
(e)~~ $\dsp x\mapsto {2\over x(x^2+1)^3}$
\medskip

{\bf 10.8.} Calculer les primitives de chacunes des fractions rationnelles
trigonométriques suivantes.

(a)~~ $\dsp x\mapsto {1-\tan x\over 1+\tan x}$\kern30pt
(b)~~ $\dsp x\mapsto {1\over 1 + 2\sin^2 x}$\kern30pt
(c)~~ $\dsp x\mapsto {1\over\sin^4x+\cos^4x}$
\medskip

{\bf 10.9.} Calculer les «\?intégrales abéliennes \?» suivantes.

(a)~~ $\dsp x\mapsto {1\over x+\sqrt{x-1}}$\kern30pt
(b)~~ $\dsp x\mapsto {1\over x}\sqrt{{x^2-1\over 4-x^2}}$
\medskip

{\bf 10.10.} Déterminer les primitives $\dsp\int e^{ax}\cos(bx)\,dx$ et
$\dsp\int e^{ax}\sin(bx)\,dx$ où $a,\,b\in\bR$.
\medskip

{\bf 10.11.} Calculer 

(a)~~ $\dsp\int_0^1{1+\arctan x\over 1+x^2}\,dx$\kern30pt
(b)~~ $\dsp\int_a^b {dx\over x\ln x}$ $(a,\,b>1)$\smallskip
(c)~~ $\dsp\int_a^{1/a} {\ln x\over 1+x^2}\,dx$ $(a>0)$\kern30pt
(d)~~ $\dsp\int_0^a e^{-\sqrt{t}}\,dt$
\medskip

{\bf 10.12.}
Démontrer les résultats suivants.

(a)~~ $\dsp
\lim_{n\rightarrow+\infty} \sum_{k=0}^{n-1} {1\over n+k} 
=\int_0^1 {1\over 1+x}\,dx = \ln(2)$\smallskip
(b)~~ 
$\dsp\lim_{n\rightarrow+\infty} {1\over n}\sum_{k=1}^{n} {n^2\over (n+k)^2} 
=\int_0^1 {1\over (1+x)^2}\,dx = {1\over 2}$\smallskip
(c)~~ $\dsp\lim_{n\rightarrow+\infty} n\sum_{k=n}^{2n-1} {1\over k^2}
=\int_0^1 {1\over (1+x)^2}\,dx = {1\over 2}$\smallskip
(d)~~ $\dsp
\lim_{n\rightarrow+\infty} \sum_{k=1}^{n} {1\over \sqrt{n^2+2kn}} 
=\int_0^1 {1\over \sqrt{1+2x}}\,dx = \sqrt{3}-1$\smallskip
(e)~~ $\dsp\lim_{n\rightarrow+\infty} \sum_{k=0}^{2n} {k\over k^2+n^2} 
=\int_0^2 {x\over 1+x^2}\,dx = {1\over 2}\ln(5)$\smallskip
(f)~~
$\dsp\lim_{n\rightarrow+\infty} \sum_{k=1}^n \sqrt{{n-k\over n^3+n^2 k}} 
=\int_0^1 \sqrt{{1-x\over 1+x}}\,dx = {\pi\over 2}-1.$
\medskip

{\bf 10.13.} Évaluer les limites de sommes de Riemann suivantes

(a)~~ $\dsp
\lim_{n\to+\infty}{1\over n^3}\sum_{k=1}^n k^2\sin\Big({k\pi\over n}\Big)$
\smallskip
(b)~~ $\dsp
\lim_{n\to+\infty}\prod_{k=1}^n\Big(1+{k^2\over n^2}\Big)^{1/n}$
\smallskip
(c)~~ $\dsp\lim_{n\to+\infty}{1\over n}\sum_{k=0}^{n-1}f\Big({k\over n}\Big)
f'\Big({k+1\over n}\Big)$ où $f\in C^1([0, 1])$.
\medskip

{\bf 10.14.} Soit $f\in C^0([a,b])$ telle que $f\ge 0$. Montrer que
$$
\lim_{n\to+\infty}\Big(\int_a^b f(x)^n\,dx\Big)^{1/n}=\sup_{x\in[a,b]} f(x).
$$

{\bf 10.15.} Soit $f\in C^0([0,1])$. Déterminer 
$\dsp\lim_{n\to+\infty}n\int_0^1 x^nf(x)\,dx$.
\medskip

{\bf 10.16.} Calculer
$\dsp\lim_{x\to 0}\int_x^{3x}{\cos t\over t}\,dt$.
\medskip

{\bf 10.17.} Calculer
$\dsp\int_0^1\Big(E\Big({2\over x}\Big)-2\,E\Big({1\over x}\Big)\Big)
\,dx$ où $E(\cdot)$ désigne la fonction partie entière.
\medskip

{\bf 10.18.}
On considère la fonction $f~: x\mapsto x^{-2}$, sur l'intervalle
$[1,2]$. Soit $n\geq 1$. Soit $D$ la subdivision régulière 
de $[1,2]$ en $n$ intervalles égaux.
{\parindent=6.5mm
\item{(a)}
Démontrer que
$$
S_D(f)=n\sum_{j=0}^{n-1} {1\over (n+j)^2}\;.
$$
\item{(b)}
Démontrer que 
$$
n\sum_{j=0}^{n-1} {1\over (n+j)(n+j+1)}
< S_D(f) < n\sum_{j=0}^{n-1} {1\over (n+j-1)(n+j)}\;.
$$
\item{(c)}
En déduire que
$$
{1\over 2}<
S_D(f)<{n(n-2)\over n(2n-1)}\;.
$$
{\it Indication}~: remarquer que 
$$
{1\over k(k+1)}={1\over k}-{1\over k+1}\;.
$$
\item{(d)} En déduire que
$$
\lim_{n\to\infty} S_D(f)={1\over 2}\;.
$$}

{\bf 10.19.}
Soient $a$ et $b$ deux réels tels que $a<b$. On considère la
fonction exponentielle $f~: x\mapsto e^x$.
{\parindent=6.5mm
\item{(a)} Soit $n\geq 1$ un entier. On considère la subdivision $D_1$ de
$[a,b]$ en $n$ intervalles égaux, pointée par la borne de gauche
de chaque intervalle. Démontrer que 
$$
S_{D_1}(f)={(b-a)e^a\over n}\,{e^{b-a}-1\over e^{(b-a)/n}-1}.
$$ 
\item{(b)} Soit $D_2$ la subdivision de
$[a,b]$ en $n$ intervalles égaux, pointée par la borne de droite
de chaque intervalle. Démontrer que 
$$
S_{D_2}(f)=e^{(b-a)/n}S_{D_1}(f).
$$ 
\item{(c)}
Démontrer que
$$
\lim_{n\to \infty} S_{D_1}(f)=
\lim_{n\to \infty} S_{D_2}(f)=e^b-e^a.
$$
}
\medskip

{\bf 10.20.} Calculer le volume du paraboloïde tronqué 
$\dsp 0\le {x^2\over a^2}+{y^2\over b^2}\le {z\over h}\le 1$
avec $a,\,b,\,h>0$.
\medskip

{\bf 10.21.} Calculer le volume du tore de grand rayon $R$ et de petit rayon 
$r<R$ engendré par la révolution autour de l'axe $Oz$ du cercle de centre
$(R,0,0)$ et de rayon $r$ situé dans le plan $xOz$.
\medskip

{\bf 10.22.} Convergence de sommes de Riemann de fonctions non bornées.
\smallskip
Soit $f:[0,1]\to\bR$ la fonction $f$ telle que
$f(x)=\ln x$ si $x\in{}]0,1]$ et $f(0)=0$. On introduit la subdivision 
pointée $D=\{([a_j,a_{j+1}],x_j)\}_{0\le j<N}$ telle que $a_0=x_0=0$
et, pour $j\ge 1$, $a_j=p^{j-N}$ où $p>1$ est un réel quelconque. 
On prend enfin $x_j=a_j$, et on définit de même une subdivision
$D'$ en prenant $x_j=a_{j+1}$. 
{\parindent=6.5mm
\item{(a)} Montrer que
$$
S_D(f)=-(p-1)\ln p\sum_{i=1}^{N-1}ip^{-i}.
$$
\item{(b)} Vérifier que
$$
\sum_{i=1}^{N-1}ix^i=x\bigg(\sum_{i=0}^{N-1}x^i\bigg)'=
x{1+(N-1)x^N-Nx^{N-1}\over (1-x)^2}
$$
et en déduire l'expression de $S_D(f)$ en fonction de $p$ et de $N$.
Calculer de même $S_{D'}(f)$.
\item{(c)} On choisit $N\ge 2$ et $p$ tel que $p^N=N^2$. Montrer
que $\lim_{N\to+\infty}S_D(f)=-1$ (on pourra observer que $p\to 1_+$
et que $\lim_{p\to 1_+}\ln p/(p-1)=(\ln p)'_{p=1}=1$).
\item{(d)} Justifier l'intégrabilité de $f$ au sens de Henstock-Kurzweil
et montrer que $\int_0^1f(x)\,dx=-1$.\vskip0pt
}
\medskip

{\bf 10.23.} Ensembles exceptionnels dénombrables.
{\parindent=6.5mm
\item{(a)}
Montrer qu'une fonction $f:[a,b]\to\bR$ qui est
nulle en dehors d'une partie dénombrable 
$E=\{u_i\}_{i\in\bN}$ de $[a,b]$ est intégrable au sens de Henstock-Kurzweil
et que son intégrale $\int_a^bf(x)\,dx$ est nulle.\\
{\it Indication~}: choisir une fonction jauge $\delta$ telle que
$\delta(u_i)\le 2^{-i}\varepsilon/(1+|f(u_i)|)$.
\item{(b)} Montrer que si deux fonctions $g,h:[a,b]\to\bR$ diffèrent
uniquement sur une partie dénombrable $E=\{u_i\}_{i\in\bN}$ de $[a,b]$,
alors l'intégrabilité de l'une  au sens de Henstock-Kurzweil
équivaut à l'intégrabilité de l'autre, et que leurs intégrales sont
égales.\medskip}

{\bf 10.24.} Soit $f$ la fonction indicatrice de $\bQ$, telle que
$$
f(x)=1\quad\hbox{si $x\in \bQ$},\qquad
f(x)=0\quad\hbox{si $x\notin \bQ$}.
$$
On rappelle que tout intervalle ouvert non vide de $\bR$ contient un
rationnel et un irrationnel. Soit $n$ un entier strictement positif. 
Pour $j=0,\ldots,n$, on pose $a_j=j/n$.
{\parindent=6.5mm
\item{(a)} Montrer à l'aide de l'exercice  précédent que $f$ est
intégrable au sens de Henstock-Kurzweil sur l'intervalle $[0,1]$.
\item{(b)} Soit $([a_j,a_{j+1}])$ une subdivision de $[0,1]$.
Montrer que pour tout \hbox{$j=0,\ldots,n-1$}, il existe
$x_j,y_j\in[a_j,a_{j+1}]$ tels que $f(x_j)=1$ et $f(y_j)=0$.
\item{(c)}
On considère les deux subdivisions pointées 
$$
D_1=\{([a_j,a_{j+1}],x_j)\}_{0\leq j<n}
\quad\hbox{et}\quad
D_2=\{([a_j,a_{j+1}],y_j)\}_{0\leq j<n}.
$$
Montrer que $S_{D_1}(f)=1$ et $S_{D_2}(f)=0$.
\item{(d)}
En déduire que $f$ n'est pas intégrable au sens de Riemann sur
$[0,1]$.}
\medskip

{\bf 10.25.}
Soit $f$ une fonction de $[a,b]$ dans $\bR$ et $n$ un entier. 
On note $A_n$ l'intégrale suivante, si elle existe.
$$
A_n = \int_a^b f(x)\sin(n x)\,dx.
$$
{\parindent=6.5mm
\item{(a)}
Soit $f$ une fonction dérivable sur $[a,b]$, dont la dérivée est
continue et bornée sur $]a,b\,[$. Démontrer que pour tout $n\in\bN$,
$A_n$ existe. En utilisant une intégration par
parties, démontrer que $A_n$ tend vers $0$ quand $n$ tend vers l'infini. 
\item{(b)}
Soit $f$ une fonction en escalier sur $[a,b]$. Démontrer que pour
tout $n\in\bN$, $A_n$ existe. En utilisant la relation de
Chasles, démontrer que $A_n$ tend vers $0$ quand $n$ tend vers l'infini.
\item{(c)}
Soit $f$ une fonction continue sur $[a,b]$. Démontrer que pour
tout $n\in\bN$, $A_n$ existe. En utilisant un encadrement par des
fonctions en escalier, démontrer que $A_n$ tend vers $0$ 
quand $n$ tend vers l'infini.
\item{(d)}
Soit $f$ une fonction continue par morceaux 
sur $[a,b]$. Démontrer que pour
tout $n\in\bN$, $A_n$ existe. Démontrer que $A_n$ tend vers $0$ 
quand $n$ tend vers l'infini.
\vskip0pt}
\medskip

{\bf 10.26.}
Soit $f$ une fonction continue de $[a,b]$ dans $\bR$, telle que~:
$$
\int_a^b f(x)\,dx = (b-a)\sup_{x\in[a,b]} f(x).
$$
Démontrer que $f$ est constante.
\medskip

{\bf 10.27.}
Soit $f$ une fonction continue sur $[0,1]$ telle que
$\dsp\int_0^1 f(x)\,dx = 1/2$.
Montrer qu'il existe $a\in[0,1]$ tel que $f(a)=a$.
\medskip

{\bf 10.28.} Soit $f$ une fonction continue sur $[0,1]$.
{\parindent=6.5mm
\item{(a)}
Soit $g$ une fonction en escalier de $[0,1]$ dans $\bR$. Démontrer
que la fonction $fg$ est intégrable sur $[0,1]$. 
\item{(b)}
On suppose que pour toute
fonction en escalier $g$ de $[0,1]$ dans $\bR$, on a
$$
\int_0^1 f(x)g(x)\,dx =0.
$$
Montrer que la fonction $f$ est nulle.\vskip0pt
}
\medskip

{\bf 10.29.}
Soient $a,b,c$ trois réels tels que $a\leq c<b$.
Pour $n\in \bN^*$, on définit la fonction 
$g_n$ sur $[a,b]$ par~:
$$
g_n(x)=\cases{
n&si $x\in[c,c+1/n]$\cr
0&sinon.\cr}
$$
{\parindent=6.5mm
\item{(a)}
Soit $f$ une fonction continue sur $[a,b]$. Démontrer que
$$
\lim_{n\to \infty}\int_a^b f(x)g_n(x)\,dx= f(c)
$$
\item{(b)}
Soit $f$ une fonction croissante sur $[a,b]$. Démontrer que
$$
\lim_{n\to \infty}\int_a^b f(x)g_n(x)\,dx= \lim_{x\to c+} f(x)
$$}

{\bf 10.30.}
Soient $f$ et $g$ deux fonctions continues de $[a,b]$ dans $\bR$.
{\parindent=6.5mm
\item{(a)}
Démontrer que les fonctions $f^2$, $fg$, $g^2$ sont intégrables
sur $[a,b]$.
\item{(b)}
Soit $\lambda$ un réel quelconque. Démontrer que la fonction
$(f+\lambda g)^2$ est intégrable sur $[a,b]$ et exprimer son
intégrale en fonction des intégrales de $f^2$, $fg$ et $g^2$.
\item{(c)}
En observant que l'intégrale de $(f+\lambda g)^2$ est positive ou
nulle pour tout $\lambda\in\bR$, démontrer l'inégalité de
Cauchy-Schwarz~:
$$
\left(\int_{a}^{b}f(x)g(x)\,dx\right)^2\leq 
\left(\int_{a}^{b}f^2(x)\,dx\right)\left(\int_{a}^{b}g^2(x)\,dx\right)\;.
$$
\item{(d)}
Démontrer que l'égalité a lieu si et seulement si $f$ et $g$
sont proportionnelles. \vskip0pt}
\chapterjump

\chapterrunning{II.}
\phantom{$\ $}
\medskip
\centerline{\fourteenbf Chapitre II}
\bigskip
\centerline{\fourteenbf Calcul des intégrales en plusieurs variables}
\vskip3.7cm

L'objectif de ce chapitre est d'abord de définir les intégrales de
à plusieurs variables par la méthode de Henstock-Kurzweil, mais 
c'est surtout d'établir les principales formules permettant le 
calcul effectif de telles intégrales~:

-- Théorème de Fubini\\
-- Formule du changement de variable et jacobien\\
-- Formes différentielles et calcul extérieur\\
-- Formule de Stokes.

Ces formules sont indispensables en Physique, notamment en dimensions
2 et 3. Il est cependant beaucoup plus commode de se placer d'emblée
en dimension arbitraire de manière à unifier les notations -- et
accessoirement, pour éviter la répétition fastidieuse de
démonstrations particulières qui occultent la simplicité de la
preuve générale. Nous situons ce Chapitre comme étant au niveau
du L2 dans l'idéal (et de manière plus réaliste, au niveau du L3 dans 
les conditions actuelles, ce qui vient malheureusement trop tard pour 
la Physique$\,$...)
\bigskip

\section{1. Intégration sur un pavé fermé borné}

La plus grande partie des résultats que nous avons obtenus au Chapitre~I
fonctionnent tout aussi bien avec des fonctions $f$ de plusieurs
variables, $(x_1,\ldots,x_n)\mapsto f(x_1,\ldots,x_n)$, définies sur
des pavés fermés bornés
$$
P=[a_1,b_1]{}\times\ldots\times{}[a_n,b_n],\qquad a_i<b_i.\leqno(1.1)
$$
Le volume et le diamètre du pavé $P$ sont par définition 
$$
\vol(P)=\prod_{1\le i\le n}(b_i-a_i),\qquad
\diam(P)=\max_{1\le i\le n}\{b_i-a_i\}\leqno(1.2)
$$ 
(il sera commode d'utiliser la
norme $\Vert x\Vert=\max_{1\le i\le n}\{|x_i|\}$ et la distance associée
\hbox{$d(x,y)=\max_{1\le i\le n}\{|x_i-y_i|\}$} sur $\bR^n$ dans tout le reste
de ces notes). Dans le cas de la dimension $n=1$, le volume se réduit
naturellement à la notion de longueur d'un intervalle, et dans le cas de
la dimension $2$ à celui de l'aire d'un rectangle.

\InsertFig 10.000 66.000 {
1 mm unit
  5.000  10.000 moveto 
 97.000   0.000 2.4 vector 
 10.000   5.000 moveto 
 55.000  90.000 2.4 vector
 31.000  27.000 moveto  0.700 disk
 43.000  24.000 moveto  0.700 disk
 55.000  23.000 moveto  0.700 disk
 75.000  24.000 moveto  0.700 disk
 22.000  39.000 moveto  0.700 disk
 27.000  47.000 moveto  0.700 disk
 35.000  42.000 moveto  0.700 disk
 44.000  46.000 moveto  0.700 disk
 49.000  44.000 moveto  0.700 disk
 36.000  38.000 moveto  0.700 disk
 41.000  32.000 moveto  0.700 disk
 46.000  36.000 moveto  0.700 disk
 54.000  34.000 moveto  0.700 disk
 53.000  45.000 moveto  0.700 disk
 59.000  38.000 moveto  0.700 disk
 63.000  46.000 moveto  0.700 disk
 68.000  29.000 moveto  0.700 disk
 77.000  37.000 moveto  0.700 disk
 76.000  44.000 moveto  0.700 disk
 75.000  29.000 moveto  0.700 disk
  0.339 setlinewidth
 18.000  21.000 moveto  80.000  49.000 rectangle stroke
 18.000  21.000 moveto  39.000  34.000 rectangle stroke
 39.000  21.000 moveto  50.000  28.000 rectangle stroke
 50.000  21.000 moveto  64.000  30.000 rectangle stroke
 64.000  21.000 moveto  80.000  27.000 rectangle stroke
 18.000  34.000 moveto  31.000  43.000 rectangle stroke
 18.000  43.000 moveto  37.000  49.000 rectangle stroke
 37.000  41.000 moveto  48.000  49.000 rectangle stroke
 31.000  34.000 moveto  44.000  41.000 rectangle stroke
 44.000  28.000 moveto  50.000  41.000 rectangle stroke
 50.000  38.000 moveto  56.000  49.000 rectangle stroke
 56.000  30.000 moveto  72.000  43.000 rectangle stroke
 72.000  40.000 moveto  80.000  49.000 rectangle stroke
 72.000  27.000 moveto  80.000  33.000 rectangle stroke
  0.113 setlinewidth
[ 1.000   0.500 ] 0 setdash
 10.000  21.000 moveto  17.200  21.000 lineto stroke
 10.000  49.000 moveto  17.200  49.000 lineto stroke
 18.000  11.500 moveto  18.000  20.200 lineto stroke
 80.000  11.500 moveto  80.000  20.200 lineto stroke
stroke 
  0.339 setlinewidth
 18.000  10.000 moveto   0.700   0.000 indent 
 80.000  10.000 moveto   0.700   0.000 indent 
 10.000  21.000 moveto   0.700  90.000 indent 
 10.000  49.000 moveto   0.700  90.000 indent 
}
\LabelTeX   87.000  34.000 $P$\ELTX
\LabelTeX   66.000  36.500 $Q_j$\ELTX
\LabelTeX   57.700  34.500 $x_j$\ELTX
\LabelTeX   17.000   6.500 $a_1$\ELTX
\LabelTeX   79.300   6.500 $b_1$\ELTX
\LabelTeX    5.000  20.000 $a_2$\ELTX
\LabelTeX    5.000  49.000 $b_2$\ELTX
\LabelTeX  100.500   6.200 $x$\ELTX
\LabelTeX    6.200  58.000 $y$\ELTX
\EndFig
\vskip-4pt
\centerline{{\bf Fig.~13.} Subdivision pointée d'un pavé $P$ de $\bR^n$.}
\medskip

On appelle {\it subdivision} de $P$ toute famille $D=(Q_j)_{0\le j<N}$
formée de pavés fermés $Q_j\subset P$
d'intérieurs disjoints (et non vides) tels que $P=\bigcup Q_j$. On dit 
que l'on a une {\it subdivision pointée} de $P$
si on s'est donné de plus des points $x_j\in Q_j$ dans chacun des pavés 
de la subdivision, et on note $D=(Q_j,x_j)_{0\le j<N}$ une telle famille.

Notons qu'une subdivision $(Q_j)$ n'est pas nécessairement une subdivision
produit (c'est-à-dire une subdivision obtenue en prenant des subdivisisons 
de chacune des arêtes $[a_i,b_i]$ de $P$ et les pavés produits
correspondants). Cependant, en considérant les projections de tous les
sommets des pavés $Q_j$ sur chacun des axes, on définit une
subdivision produit $(Q'_k)$ plus fine que $(Q_j)$ (c'est-à-dire telle que
chaque $Q_j$ est la réunion d'un nombre fini des $Q'_k$). Dans tous les cas
on a
$$
\vol(P)=\sum_{0\le j<N}\vol(Q_j)\;;\leqno(1.3)
$$
en effet, si $(Q_j)$ est une subdivision produit, c'est évident par 
distributivité de la multiplication par rapport à l'addition, et le
cas général s'y ramène en considérant la subdivision produit
$(Q'_k)$ de $P$ qui décompose simultanément tous les pavés $Q_j$.

La {\it somme de Riemann} associée à $f$ sur $D=(Q_j,x_j)_{0\le j<N}$ 
est définie comme
$$
S_D(f)=\sum_{0\le j<N}f(x_j)\vol(Q_j).\leqno(1.4)
$$
Si $\delta:P\to\bR^*_+$ est une {\it jauge} (c'est-à-dire une fonction 
positive arbitraire), on dit
que la subdivision $D$ est $\delta$-fine si $\diam(Q_j)\le\delta(x_j)$
pour tout~$j$.  L'existence de subdivisions $\delta$-fines se
généralise aussitôt à la dimension $n$, en utilisant une 
dichotomie comme dans la preuve du lemme~I.2.6 (on divise chacune des 
arêtes en $2$ moitiés selon les axes
$x_1,\ldots,x_n$, ce qui produit $2^n$ pavés à chaque étape).
La définition I.2.7 peut se calquer mot à mot dans le cas des
fonctions de plusieurs~variables.
\bigskip

\vbox{%
{\bf (1.5) Définition}. {\it Soit $f:P\to\bR$ une fonction définie sur 
un pavé fermé borné.
{\parindent=6.5mm
\item{\rm (a)} On dit que $f$ est
intégrable au sens de Henstock-Kurzweil $($ou HK-intégrable$)$ sur~$P$
s'il exis\-te un réel $A$ tel que pour tout $\varepsilon>0$ donné 
a priori, on peut trouver une
jauge $\delta:P\to\bR^*_+$ $($dite $\varepsilon$-adaptée à $f)$, 
en sorte que pour toute subdivision pointée $D=\{(Q_j,x_j)\}$ de $P$
on ait
$$
\diam(Q_j)\le \delta(x_j)~\hbox{pour tout $j$} 
\Rightarrow |S_D(f)-A|\le\varepsilon.
$$
\item{\rm (b)} De même, on dit que $f$ est
intégrable au sens de Riemann $($ou Riemann-intégrable$)$ sur $P$
si on peut de plus choisir la jauge $\delta$ constante, c'est-à-dire si
pour tout $\varepsilon>0$ il existe une constante $\delta>0$ telle que
$$
\diam(Q_j)\le \delta~\hbox{pour tout $j$} \Rightarrow |S_D(f)-A|\le\varepsilon.
$$}%
Dans l'un ou l'autre cas, on note
$$
\int_P f(x_1,\ldots,x_n)\,dx_1\ldots dx_n,
$$
ou même simplement $A=\int_P f(x)\,dx$, et on appelle $A$ l'intégrale de 
$f$ sur le pavé~$P$.}}
\medskip

L'un des principaux critères d'intégrabilité que nous utiliserons
dans la suite est le critère de Cauchy.
\medskip

{\bf (1.6) Critère de Cauchy}. {\it Soit $f:P\to\bR$ une fonction
définie sur un pavé $P$ fermé borné. Pour que $f$ soit
HK-intégrable $($resp.\ Riemann-intégrable$)$, il faut et il suffit que 
pour tout $\varepsilon>0$ il existe une jauge $\delta:P\to\bR_+^*$
$($resp.\ une constante $\delta>0)$, telle que
pour toutes subdivisions pointées $D$ et~$D'$ $\delta$-fines on ait
$|S_{D'}(f)-S_D(f)|\le\varepsilon$.  }

{\it Démonstration.} Si $f$ est HK-intégrable d'intégrale $A$,
pour chaque jauge
$\delta$ qui est $\varepsilon/2$-adaptée à $f$, les
inégalités $|S_D(f)-A|\le\varepsilon/2$ et
$|S_{D'}(f)-A|\le\varepsilon/2$ pour $D,\;D'$ $\delta$-fines
entraînent $|S_{D'}(f)-S_D(f)|\le\varepsilon$.  La réciproque
est une conséquence de la complétude de $\bR$, ou, de façon
équivalente, de l'existence de bornes supérieures et inférieures
pour les parties bornées de~$\bR$. En effet, supposons que pour tout
entier $n\ge 1$ il existe une jauge $\delta_n$ telle que
$$
|S_{D'}(f)-S_D(f)|\le\varepsilon_n=1/n\qquad\hbox{lorsque
$D$ et $D'$ sont $\delta_n$-fines}.
$$
Quitte à remplacer $\delta_n$ par $\min(\delta_1,\delta_2,\ldots,\delta_n)$
on peut  supposer la suite $\delta_n$ décroissante. L'encadrement
précédent montre que les quantités
$$
M_\ell=\sup\big\{S_{D'}(f)\,;\;\hbox{$D'$ $\delta_\ell$-fine}\big\}
$$
sont bornées et vérifient $|M_\ell-S_D(f)|\le 1/n$ pour tout $\ell\ge n$
et toute subdivision $D$ $\delta_n$-fine. De plus la
suite $(M_\ell)$ est décroissante bornée, et si on pose
$A=\inf\{M_\ell\}$, on trouve $|A-S_D(f)|\le 1/n$ pour toute subdivision
$D$ $\delta_n$-fine.  Ceci implique
$$
\lim_{\HK,\;D}S_D(f)=A=\inf_{\ell>0}M_\ell,\qquad\hbox{donc $f$
HK-intégrable d'intégrale $A$}.\eqno\square
$$

On dit qu'une subdivision pointée $\tilde D=(\tilde Q_k,\tilde x_k)$ est
{\it emboîtée} dans une autre subdivision pointée $D=(Q_j,x_j)$ si
tout pavé $Q_j$ de $D$ se décompose comme une réunion
$$
Q_j=\bigcup_{\tilde Q_k\subset Q_j}\tilde Q_k
$$
de pavés de $D'$ (cf.\ Fig.~14).

\InsertFig 15.000 42.000 {
1 mm unit
  0.000 -17.000 translate
 23.000  26.000 moveto  0.700 disk
 43.000  24.000 moveto  0.700 disk
 55.000  23.000 moveto  0.700 disk
 75.000  24.000 moveto  0.700 disk
 22.000  39.000 moveto  0.700 disk
 27.000  47.000 moveto  0.700 disk
 35.000  42.000 moveto  0.700 disk
 44.000  46.000 moveto  0.700 disk
 49.000  44.000 moveto  0.700 disk
 36.000  38.000 moveto  0.700 disk
 41.000  32.000 moveto  0.700 disk
 46.000  36.000 moveto  0.700 disk
 54.000  34.000 moveto  0.700 disk
 53.000  45.000 moveto  0.700 disk
 59.000  38.000 moveto  0.700 disk
 63.000  46.000 moveto  0.700 disk
 68.000  29.000 moveto  0.700 disk
 77.000  37.000 moveto  0.700 disk
 76.000  44.000 moveto  0.700 disk
 75.000  29.000 moveto  0.700 disk
gsave
  0.339 setlinewidth
 33.700  29.900 translate
 -0.33871  -0.46428 scale
-33.700 -29.900 translate
  1.000  0.000  0.000 setrgbcolor
 43.000  24.000 moveto  0.700 disk
 55.000  23.000 moveto  0.700 disk
 75.000  24.000 moveto  0.700 disk
 22.000  39.000 moveto  0.700 disk
 27.000  47.000 moveto  0.700 disk
 35.000  42.000 moveto  0.700 disk
 44.000  46.000 moveto  0.700 disk
 49.000  44.000 moveto  0.700 disk
 36.000  38.000 moveto  0.700 disk
 41.000  32.000 moveto  0.700 disk
 46.000  36.000 moveto  0.700 disk
 54.000  34.000 moveto  0.700 disk
 53.000  45.000 moveto  0.700 disk
 59.000  38.000 moveto  0.700 disk
 63.000  46.000 moveto  0.700 disk
 68.000  29.000 moveto  0.700 disk
 77.000  37.000 moveto  0.700 disk
 76.000  44.000 moveto  0.700 disk
 75.000  29.000 moveto  0.700 disk
 18.000  21.000 moveto  80.000  49.000 rectangle stroke
 18.000  21.000 moveto  39.000  34.000 rectangle stroke
 39.000  21.000 moveto  50.000  28.000 rectangle stroke
 50.000  21.000 moveto  64.000  30.000 rectangle stroke
 64.000  21.000 moveto  80.000  27.000 rectangle stroke
 18.000  34.000 moveto  31.000  43.000 rectangle stroke
 18.000  43.000 moveto  37.000  49.000 rectangle stroke
 37.000  41.000 moveto  48.000  49.000 rectangle stroke
 31.000  34.000 moveto  44.000  41.000 rectangle stroke
 44.000  28.000 moveto  50.000  41.000 rectangle stroke
 50.000  38.000 moveto  56.000  49.000 rectangle stroke
 56.000  30.000 moveto  72.000  43.000 rectangle stroke
 72.000  40.000 moveto  80.000  49.000 rectangle stroke
 72.000  27.000 moveto  80.000  33.000 rectangle stroke
  grestore
  0.000 setgray
  0.339 setlinewidth
 18.000  21.000 moveto  80.000  49.000 rectangle stroke
 18.000  21.000 moveto  39.000  34.000 rectangle stroke
 39.000  21.000 moveto  50.000  28.000 rectangle stroke
 50.000  21.000 moveto  64.000  30.000 rectangle stroke
 64.000  21.000 moveto  80.000  27.000 rectangle stroke
 18.000  34.000 moveto  31.000  43.000 rectangle stroke
 18.000  43.000 moveto  37.000  49.000 rectangle stroke
 37.000  41.000 moveto  48.000  49.000 rectangle stroke
 31.000  34.000 moveto  44.000  41.000 rectangle stroke
 44.000  28.000 moveto  50.000  41.000 rectangle stroke
 50.000  38.000 moveto  56.000  49.000 rectangle stroke
 56.000  30.000 moveto  72.000  43.000 rectangle stroke
 72.000  40.000 moveto  80.000  49.000 rectangle stroke
 72.000  27.000 moveto  80.000  33.000 rectangle stroke
}
\LabelTeX   33.500  12.700 $\RGBColor{1 0 0}{\tilde Q_k}$\ELTX
\LabelTeX   82.000  17.000 $P$\ELTX
\LabelTeX   66.000  19.500 $Q_j$\ELTX
\LabelTeX   57.700  17.500 $x_j$\ELTX
\EndFig
\centerline{{\bf Fig.~14.} Subdivisions emboîtées $D$ et
$\tilde D$.}
\medskip

Étant donné deux subdivisions
pointées $D'=(Q'_j,x'_j)$ et $D''=(Q''_k,x''_k)$ $\delta$-fines, on peut
produire une subdivision pointée $\smash{\tilde D=(\tilde Q_\ell,
\tilde x_\ell)}$ $\delta$-fine emboîtée à la fois dans $D'$ et~$D''$
en considérant tous les pavés intersections $Q'_j\cap Q''_k$
d'intérieur non vide, et en prenant une subdivision pointée
$\delta$-fine de chacune de ces intersections. Si le critère de Cauchy
est satisfait pour des subdivisions emboîtées, on a alors
$|S_{D'}(f)-S_{\tilde D}(f)|\le\varepsilon$ et
$|S_{D''}(f)-S_{\tilde D}(f)|\le\varepsilon$, donc
$|S_{D''}(f)-S_{D'}(f)|\le 2\varepsilon$ pour $D'$ et $D''$ $\delta$-fines
quelconques.
\medskip

{\bf (1.7) Conséquence.} {\it Pour appliquer le critère de Cauchy,
il suffit de considérer des paires de subdivisions $D$, $D'$ 
emboîtées.}
\medskip

On exploite cette observation à l'aide du lemme
schématisé par la figure ci-dessous.

\InsertFig 10.000 66.000 {
/riem {/y exch 10.0 add def /a2 exch def /a1 exch def
   a1 10.000 moveto  a1 y lineto  a2 y lineto  a2 10.000 lineto } def
/box {/z exch 10.0 add def  /y exch 10.0 add def 
      /a2 exch def /a1 exch def
   a1 y moveto  a1 z lineto  a2 z lineto  a2 y lineto } def
1 mm unit
 28.000  35.700 moveto  28.000  51.000 lineto stroke
 28.000  51.000 moveto 0.000 90 2.4 vector
 28.000  35.700 moveto 0.000 -90 2.4 vector
 32.000  55.000 moveto  44.000  55.000 lineto stroke
 32.000  55.000 moveto  0.000 180 2.4 vector
 44.000  55.000 moveto  0.000 0 2.4 vector
  0.84 setgray
 18.000  32.000  14.000 25.700 box fill
 32.000  44.000  25.700 41.000 box fill
 44.000  48.000  19.300 32.000 box fill
 48.000  50.000  28.000 30.100 box fill
 50.000  53.000  17.900 28.000 box fill
 53.000  56.000  20.700 31.900 box fill
 56.000  58.000  14.200 32.200 box fill
 58.000  65.000  11.500 14.500 box fill
 65.000  71.000  14.500 27.200 box fill
 71.000  80.000  27.200 30.300 box fill
  0.000 setgray
  5.000  10.000 moveto  97.000   0.000 2.4 vector 
 10.000   5.000 moveto  55.000  90.000 2.4 vector 
  0.200 setlinewidth
 18.000  24.000 moveto 
[  18.000  24.000   25.000  27.000   
   43.000  49.000   44.000  42.000  
   46.000  30.000   46.500  31.000   
   48.400  39.000   49.000  40.000   49.500  39.200   
   51.400  29.000   52.000  28.000   52.500  29.200
   55.400  41.000   56.000  42.000   56.500  39.200   
   60.000  22.000   75.000  40.000   80.000  40.000  ] curve 
stroke 
  0.339 setlinewidth
 18.000  10.000 moveto   0.700   0.000 indent 
 80.000  10.000 moveto   0.700   0.000 indent 
  0.113 setlinewidth
  1.000   0.000   0.000 setrgbcolor
 18.000  23.000  15.000 riem stroke
 23.000  27.000  17.000 riem stroke
 27.000  32.000  22.000 riem stroke
 32.000  36.000  29.000 riem stroke
 36.000  39.000  36.000 riem stroke
 39.000  41.000  40.000 riem stroke
 41.000  43.000  40.500 riem stroke
 43.000  44.000  37.000 riem stroke
 44.000  45.000  29.000 riem stroke
 45.000  46.000  19.500 riem stroke
 46.000  47.000  21.000 riem stroke
 47.000  48.000  25.000 riem stroke
 48.000  49.000  30.000 riem stroke
 49.000  50.000  29.500 riem stroke
 50.000  51.000  22.000 riem stroke
 51.000  52.000  19.000 riem stroke
 52.000  53.000  18.500 riem stroke
 53.000  54.000  22.000 riem stroke
 54.000  55.000  28.000 riem stroke
 55.000  56.000  31.000 riem stroke
 56.000  57.000  30.500 riem stroke
 57.000  58.000  15.500 riem stroke
 58.000  59.000  13.500 riem stroke
 59.000  63.000  12.000 riem stroke
 63.000  65.000  13.000 riem stroke
 65.000  68.000  18.000 riem stroke
 68.000  71.000  25.000 riem stroke
 71.000  74.000  29.000 riem stroke
 74.000  80.000  30.000 riem stroke
  0.000   0.000   1.000 setrgbcolor
 18.000  32.000  23.000 riem stroke
 32.000  44.000  38.000 riem stroke
 44.000  48.000  24.000 riem stroke
 48.000  50.000  29.000 riem stroke
 50.000  53.000  24.000 riem stroke
 53.000  56.000  27.000 riem stroke
 56.000  58.000  23.000 riem stroke
 58.000  65.000  13.000 riem stroke
 65.000  71.000  21.000 riem stroke
 71.000  80.000  29.000 riem stroke
 38.300  10.000 moveto 0.5 disk
  0.339 setlinewidth
 32.000  10.000 moveto   0.700   0.000 indent 
 44.000  10.000 moveto   0.700   0.000 indent 
  1.000   0.000  0.000 setrgbcolor
 90.000  25.000 moveto 100.000  25.000 lineto stroke
  0.000   0.000  1.000 setrgbcolor
 90.000  32.000 moveto 100.000  32.000 lineto stroke
}
\LabelTeX   18.000   6.500 $P$\ELTX
\LabelTeX  100.500   6.200 $x$\ELTX
\LabelTeX    1.200  58.000 $f(x)$\ELTX
\LabelTeX   12.000  43.000 $\oscil_{Q_j}(f)$\ELTX
\LabelTeX   31.000  58.000 $\vol(Q_j)$\ELTX
\LabelTeX   31.500   6.500 $\RGBColor{0 0 1}{Q_j}$\ELTX
\LabelTeX   37.500   6.500 $\RGBColor{0 0 1}{x_j}$\ELTX
\LabelTeX  102.000  31.500 $\RGBColor{0 0 1}{D}$\ELTX
\LabelTeX  102.000  24.500 $\RGBColor{1 0 0}{D'}$\ELTX
\EndFig
\vskip-10pt
\centerline{{\bf Fig.~15.} Écart entre sommes de Riemann emboîtées.}
\medskip\medskip

\vbox{%
{\bf (1.8) Lemme.} {\it Si $D'$ est emboitée dans $D=(Q_j,x_j)$, on a 
la majoration
$$
\big|S_{D'}(f)-S_D(f)\big|\le\sum_{j}\oscil_{Q_j}(f)\vol(Q_j)
$$
où $\smash{\displaystyle
\oscil_{Q_j}(f)=\sup_{x,y\in Q_j}|f(x)-f(y)|}$ désigne l'oscillation 
de $f$ sur $Q_j$.}}
\medskip

{\it Démonstration.} Chaque terme $f(x_j)\vol(Q_j)$ de $S_D(f)$ correspond
dans $S_{D'}(f)$ à une sommation $\sum_{Q'_k\subset Q_j}f(x'_k)\vol(Q'_k)$.
Comme $\vol(Q_j)=\sum_{Q'_k\subset Q_j}\vol(Q'_k)$, on a 
$$
\eqalign{
\Big|f(x_j)\vol(Q_j)&{}-\sum_{Q'_k\subset Q_j}f(x'_k)\vol(Q'_k)\Big|
=\Big|\sum_{Q'_k\subset Q_j}\big(f(x_j)-f(x'_k)\big)\vol(Q'_k)\Big|\cr
&\le\oscil_{Q_j}(f)\sum_{Q'_k\subset Q_j}\vol(Q'_k)=\oscil_{Q_j}(f)
\vol(Q_j).\cr}
$$
L'inégalité du lemme s'obtient en sommant sur l'indice~$j$.\qed
\medskip

{\bf (1.9) Corollaire.} {\it Si $f$ est HK-intégrable sur le pavé
fermé borné $P$ et si $D=(Q_j,x_j)$ est une subdivision pointée
de $P$, on a
$$
\Big|\int_Pf(x)\,dx-S_D(f)\Big|\le\sum_{j}\oscil_{Q_j}(f)\vol(Q_j).
$$}

{\it Démonstration.} Ceci résulte du lemme 1.8 et du fait que
$\int_Pf(x)\,dx=\lim_{\HK,\,D'}S_{D'}(f)$ en prenant la limite sur
les subdivisions pointées $D'$ emboîtées dans~$D$.\qed
\medskip

{\bf (1.10) Théorème.} {\it Toute fonction continue $f:P\to\bR$ définie
sur un pavé fermé borné est intégrable au sens de Riemann 
$($et donc HK-intégrable$)$ sur~$P$.}
\medskip

{\it Démonstration.} Pour tout $x\in P$, la continuité de $f$ en
$x$ montre qu'il existe $\delta(x)>0$ tel que pour tout pavé $Q$
contenant $x$ de diamètre${}\le\delta(x)$ on ait
\hbox{$|f(y)-f(x)|\le\varepsilon$}, et donc $\oscil_Q(f)\le 2\varepsilon$. 
Si $D$ et $D'$ sont des subdivisions $\delta$-fines emboîtées, 
le lemme 1.8 implique $|S_{D'}(f)-S_D(f)|\le
2\varepsilon\sum\vol(Q_j)=2\varepsilon\vol(P)$, ce qui démontre
l'intégrabilité au sens de Henstock-Kurzweil.  En réalité, $f$
est uniformément continue et on peut remplacer $\delta$ par une jauge
constante~: si
$\eta$ est le minimum des arêtes des pavés intervenant dans une
subdivision $\delta$-fine quelconque $D_0$ fixée, tout pavé $Q$ de
diamètre${}\le \eta$ va rencontrer l'un des pavés $Q^0_j$ de $D_0$ et
sera contenu dans la réunion de $Q_j^0$ avec les pavés $Q^0_k$ qui
lui sont adjacents, de sorte que $\oscil_{Q}(f)\le 4\varepsilon$. Ceci
implique que $|S_{D'}(f)-S_D(f)|\le 4\varepsilon\vol(P)$ pour tout
couple de subdivisions $D$ et $D'$ emboîtées
$\eta$-fines. L'intégrabilité au sens de Riemann s'ensuit.\qed
\medskip

D'autre part, nous avons les résultats basiques suivants qui généralisent
la formule de Chasles.
\medskip

{\bf (1.11) Proposition.} {\it Soit $f : P\to\bR$ une fonction
HK-intégrable $($resp.\ Riemann-intégrable$)$ sur un pavé
fermé borné~$P$.  Alors la restriction $f_{|Q}$ de $f$ à tout
pavé fermé $Q\subset P$ est encore HK-intégrable $($resp.\
Riemann-intégrable$)$.}

{\it Démonstration.} On utilise le critère de Cauchy. Étant donné 
$\varepsilon>0$, il existe une jauge $\delta$ sur $P$ telle
que $|S_D(f)-S_{D'}(f)|\le\varepsilon$ pour toutes subdivisions pointées
$\delta$-fines $D$ et $D'$ de~$P$. Soient maintenant $\Delta$ et $\Delta'$
deux subdivisions pointées de $Q$ qui sont $\delta_{|Q}$-fines.
Comme $P\ssm Q$ est une réunion finie de pavés
d'intérieurs disjoints, on peut compléter $\Delta$ et $\Delta'$
en des subdivisions pointées $D$ et $D'$ de $P$ qui sont $\delta$-fines
(et on peut naturellement prendre le même découpage et les mêmes 
points $x_j$ sur $P\ssm Q$). On obtient alors
$$
|S_{\Delta}(f)-S_{\Delta'}(f)|=|S_D(f)-S_{D'}(f)|\le\varepsilon.
$$
La proposition est démontrée. Pour l'intégrabilité au sens de Riemann
la preuve est tout à fait analogue.\qed
\medskip

{\bf (1.12) Proposition (relation de Chasles).} {\it Étant donné un
découpage $P=\bigcup P_i$ d'un pavé fermé borné $P$ en pavés
fermés $P_i$ d'intérieurs disjoints, une fonction $f:P\to\bR$ est
HK-intégrable sur $P$ si et seulement si elle est intégrable sur
chaque pavé~$P_i$, et on a alors
$$
\boxed{16}{
\int_P f(x)\,dx = \sum_i \int_{P_i} f(x)\,dx.}
$$
}

{\it Démonstration.} Pour simplifier l'exposé, on va procéder d'une 
façon un peu plus «\?brutale\?» que ce que nous avions fait en 
dimension $1$ (bien qu'une méthode analogue reste possible).
Choisissons des fontions jauges $\varepsilon$-adaptées $\delta_i$ sur chaque
pavé~$P_i$. On considère une jauge $\delta$ sur $P=\bigcup P_i$
telle que $\delta\le\delta_i$ sur $P_i$, en {\it imposant la
condition supplémentaire suivante}$\,$: soit $\partial P_i$ le bord 
de $P_i$ (réunion de chacune des faces pour lesquelles
l'une des coordonnées $x_k$ est constante)$\,$; pour tout $x\in P$,
on demande que $\delta$ satisfasse
$$
\delta(x)\le \min_{i,\, \partial P_i\not\ni x}d(x,\partial P_i).
$$
De cette manière, si $x\in P$ et si $Q\subset P$ est un pavé
contenant $x$ de diamètre \hbox{$\diam(Q)\le\delta(x)$}, ou bien $x$ est
dans l'intérieur $P_i^\circ$ d'un des pavés, auquel cas\break
\hbox{$\delta(x)\le d(x,\partial P_i)$} et donc $Q\subset P_i$, ou bien $x$
appartient à certains bords $\partial P_{i_1},\,\ldots\,$,~$\partial
P_{i_N}$. Dans ce cas $x$ n'appartient à aucun autre pavé $P_i$, et
les inégalités $\diam(Q)\le\delta(x)\le d(x,\partial P_i)$ impliquent 
$Q\subset\complement P_i^\circ$. Il~en résulte que $Q\subset
P_{i_1}\cup\ldots\cup P_{i_N}$ et donc dans tous les cas
$Q=\bigcup_{i,\,P_i\ni x}P_i\cap Q\,$; on~peut évidemment limiter
cette union aux indices $i$ tels que l'intérieur $(P_i\cap Q)^\circ$
soit non vide.  Soit alors $D=(Q_j,x_j)$ une subdivision
$\delta$-fine. D'après ce qui précède, la famille $D_i=\{(P_i\cap
Q_j,x_j)\}_{j,\,x_j\in P_i,\,(P_i\cap Q_j)^\circ\ne\emptyset}$ constitue
une subdivision pointée $\delta_i$-fine de $P_i$.  L'intérêt est
qu'il n'est pas nécessaire de changer les points de marquage $x_j$, parce 
que ceux-ci appartiennent nécessairement aux faces $\partial P_i$ lorsque 
les pavés $Q_j$ se découpent suivant plusieurs pavés $P_i$. On a 
donc $S_D(f)=\sum_i
S_{D_i}(f)$ avec $|S_{D_i}(f)-\int_{P_i}f(x)\,dx|\le\varepsilon$
et la proposition 1.12 s'ensuit par passage à la
limite.\qed
\medskip

{\bf (1.13) Remarque.} On peut étendre sans difficulté la
définition de l'intégrale\break $\int_Pf(x)\,dx$ au cas où $P$
est réunion finie de pavés fermés bornés.  On se ramène
aussitôt au cas des pavés grâce à la relation de Chasles.\qed
\medskip

Nous terminons ce paragraphe par la preuve d'une version élémentaire du
théorème de Fubini.
\medskip

{\bf (1.14) Thorème de Fubini (version élémentaire).} {\it 
Soit $f:[a_1,b_1]\times[a_2,b_2]\to \bR$ une fonction continue. Alors
$$
\boxed{16}{
\int_{[a_1,b_1]\times[a_2,b_2]}f(x,y)\,dx\,dy
=\int_{a_1}^{b_1}\Big(\int_{a_2}^{b_2} f(x,y)\,dy\Big)dx.}
\leqno(1.14\,{\rm a})
$$
}

{\it Commentaires.} Cet énoncé mérite quelques commentaires préalables.
L'intégrale de gauche 
$\int_{[a_1,b_1]\times[a_2,b_2]}f(x,y)\,dx\,dy$ est celle
introduite par la définition~1.5. Le calcul de l'intégrale de droite 
$\smash{\int_{a_1}^{b_1}\big(\int_{a_2}^{b_2} f(x,y)\,dy\big)dx}$
se décompose comme suit~: on commence par évaluer
$$
F(x)=\int_{a_2}^{b_2} f(x,y)\,dy
$$
pour tout $x\in[a_1,b_1]$, ce qui, d'après le théorème 6.6 produit 
une fonction continue $F:[a_1,b_1]\to \bR$. On calcule
ensuite l'intégrale ordinaire $\int_{a_1}^{b_1}F(x)\,dx$. Le
théorème de Fubini stipule que les deux résultats coïncident.
Puisqu'on peut échanger le rôle des coordonnées
$x$ et $y$, on aura aussi comme conséquence que
$$
\boxed{16}{
\int_{a_1}^{b_1}\Big(\int_{a_2}^{b_2} f(x,y)\,dy\Big)dx
=\int_{a_2}^{b_2}\Big(\int_{a_1}^{b_1} f(x,y)\,dx\Big)dy.}
\leqno(1.14\,{\rm b})
$$

{\it Démonstration.} Fixons $\varepsilon>0$. Par continuité uniforme, il 
existe alors $\delta>0$,
c'est-à-dire une jauge constante, telle que $\oscil_Q(f)=\sup_{\xi,\xi'\in Q}
|f(\xi)-f(\xi')|\le\varepsilon$ sur tout pavé 
$Q\subset P=[a_1,b_1]\times[a_2,b_2]$
de diamètre $\diam(Q)\le \delta$. Soit $D$ une subdivision produit 
\hbox{$\delta$-fine} obtenue en découpant $[a_1,b_1]$ et $[a_2,b_2]$
en $N_1$ (resp.\ $N_2$) sous-intervalles $[x_j,x_{j+1}]$ (resp.\ 
$[y_k,y_{k+1}]$) de longueur${}\le\delta$. On note $\ell=(j,k)$, 
$0\le j<N_1$, $0\le k<N_2$ et
$$
Q_\ell=[x_j,x_{j+1}]\times[y_k,y_{k+1}],\qquad \xi_\ell=(x_j,y_k)\in Q_\ell.
$$
Avec ces notations, nous avons 
$$
S_D(f)=\sum_{\ell=(j,k)}f(\xi_\ell)\vol(Q_\ell)
=\sum_{j,k}f(x_j,y_k)(x_{j+1}-x_j)(y_{k+1}-y_k)
$$
et le corollaire 1.9 donne
$$
\bigg|\int_{[a_1,b_1]\times[a_2,b_2]}f(x,y)\,dx\,dy-S_D(f)\bigg|\le
\varepsilon\vol(P).
\leqno(1.14\,{\rm c})
$$
On a d'autre part
$$
\big|F(x')-F(x)\big|
=\bigg|\int_{a_2}^{b_2}\big(f(x',y)-f(x,y\big)\,dx\,dy\bigg|
\le \varepsilon(b_2-a_2)=\varepsilon_2
$$
pour tous $x,x'\in[x_j,x_{j+1}]$, et le corollaire 1.9 appliqué à 
$F:[a_1,b_1]\to\bR$ entraîne
$$
\bigg|\int_{a_1}^{b_1}F(x)\,dx-\sum_j F(x_j)(x_{j+1}-x_j)\bigg|\le
\varepsilon_2(b_1-a_1)=\varepsilon(b_1-a_1)(b_2-a_2).
\leqno(1.14\,{\rm d})
$$
Enfin, le même raisonnement appliqué à la fonction d'une variable
$y\mapsto f(x_j,y)$ relativement à la subdivision pointée
$([y_k,y_{k+1}],y_k)$ de $[a_2,b_2]$ implique
$$
\eqalign{
\Big|F(x_j)-\sum_kf(x_j,y_k)&{}(y_{k+1}-y_k)\Big|\cr
&=\bigg|\int_{a_2}^{b_2}f(x_j,y)\,dy-\sum_kf(x_j,y_k)(y_{k+1}-y_k)\bigg|\le
\varepsilon(b_2-a_2),\cr}
$$
pour tout indice $j$, donc en multipliant par $(x_{j+1}-x_j)$ et en 
sommant on trouve
$$
\Big|\sum_jF(x_j)(x_{j+1}-x_j)-S_D(f)\Big|\le\varepsilon(b_1-a_1)(b_2-a_2).
\leqno(1.14\,{\rm e})
$$
En combinant (1.14$\,$d,e) on trouve
$$
\bigg|\int_{a_1}^{b_1}F(x)\,dx-S_D(f)\bigg|\le 
2\varepsilon(b_1-a_1)(b_2-a_2).\leqno(1.14\,{\rm f})
$$
D'après (1.14$\,$c,f) il vient par différence
$$
\bigg|\int_{[a_1,b_1]\times[a_2,b_2]}f(x,y)\,dx\,dy-
\int_{a_1}^{b_1}F(x)\,dx\bigg|\le 3\varepsilon\vol(P),
$$
ce qui conclut la démonstration puisque $\varepsilon$ est arbitraire.\qed
\medskip

Il est facile de généraliser le théorème de Fubini aux cas des 
fonctions continues sur un pavé $P=\prod[a_j,b_j]\subset\bR^n$ en toute 
dimension. On démontre ainsi que
$$
\boxed{16}{
\int_Pf(x)\,dx=\int_{[a_1,b_1]\times\ldots[a_{n-1},b_{n-1}]}
\Big(\int_{a_n}^{b_n}f(x_1,\ldots,x_n)\,dx_n\Big)dx_1\ldots dx_{n-1}}
\leqno(1.15)
$$
et on en déduit par récurrence sur $n$ qu'une intégration dans $\bR^n$ 
consiste en un calcul itéré d'intégrations à une seule variable~:
$$
\boxed{16}{
\int_Pf(x)\,dx=\int_{a_1}^{b_1}\Big(\ldots
\int_{a_{n-1}}^{b_{n-1}}
\Big(\int_{a_n}^{b_n}f(x_1,\ldots,x_n)\,dx_n\Big)dx_{n-1}\ldots\Big)dx_1.}
\leqno(1.16)
$$
L'ordre des intégrations est indifférent puisque la définition de 
l'intégrale
que nous avons donnée est invariante par permutation
des coordonnées de $\bR^n$.
\bigskip

\section{2. Intégration sur un domaine ouvert et formule du jacobien
en plusieurs variables}

Soit $\Omega$ une partie ouverte de $\bR^n$. On se propose d'étudier
l'intégration des fonctions continues $f:\Omega\to\bR$ et, dans ce
cadre, d'établir la formule de changement de
variable. L'hypothèse de continuité de la fonction $f$ pourra en fait
être levée ultérieurement sans trop de difficultés, par des
arguments de passage à limite.

Pour calculer une intégrale sur $\Omega$, on considère des
domaines $K_p$ qui sont des réunions finies de pavés fermés
d'intérieurs disjoints, de sorte que 
$$
K_0\subset K_1\ldots\subset K_p\subset\ldots\subset \Omega,\quad 
K_p\subset K_{p+1}^\circ\quad\hbox{et}\quad \Omega=\bigcup K_p.
\leqno(2.1)
$$ 
Une telle suite sera appelée
un {\it pavage exhaustif} de~$\Omega$. Une~manière simple d'obtenir 
un pavage exhaustif consiste à construire $K_p$ par récur\-rence en
prenant les cubes constituant $K_p\ssm K_{p-1}^\circ$ dans le
«\?quadrillage\?» associé à un certain réseau $2^{-s_p}\bZ^n$ 
de côté~$2^{-s_p}$, pour une suite d'entiers $s_p$ strictement
croissante adéquate (on ajoute à $K_{p-1}$ les cubes
$2^{-s_p}([0,1]^n+u)$, $u\in\bZ^n\cap[-4^{s_p},4^{s_p}[{\,}^n$, qui 
sont contenus dans $\Omega\ssm K_{p-1}^\circ$).

\InsertFig 10.000 56.000 {
1 mm unit 
/cube { d mul exch d mul exch moveto
d 0 rlineto 0 d rlineto d neg 0 rlineto closepath 
gsave colorfill grestore stroke } def
  0.339 setlinewidth
  0.000  15.000 moveto 
[   0.000  15.000    0.000  35.000   12.000  42.000   36.000  48.000  
   60.000  42.000   84.000  51.000  108.000  41.000  107.000  18.000  
   69.000   5.000  
] closedcurve stroke 
  0.226 setlinewidth
/d 10 def
/colorfill { 0.9 setgray fill 0 setgray } def
gsave
32 20 translate 
-2 0 cube -1 0 cube 0 0 cube 1 0 cube 2 0 cube 3 0 cube 4 0 cube 
5 0 cube 5 1 cube -1 -1 cube
/d 5 def
/colorfill { 1 0.84 0.84 setrgbcolor fill 1.0 0 0 setrgbcolor } def
-5 0 cube -5 1 cube -5 2 cube -4 2 cube -3 2 cube -2 2 cube -1 2 cube
 0 2 cube 1 2 cube 2 2 cube 3 2 cube 4 2 cube 5 2 cube 6 2 cube 
 7 2 cube 8 2 cube 9 2 cube 9 3 cube 9 4 cube 10 4 cube 11 4 cube
12 4 cube 12 3 cube 12 2 cube 12 1 cube 12 0 cube
13 3 cube 13 2 cube 13 1 cube 13 0 cube
-3 3 cube -2 3 cube -1 3 cube 0 3 cube 1 3 cube  2 3 cube
 7 3 cube 8 3 cube -5 -1 cube -4 -1 cube -3 -1 cube
-4 -2 cube -3 -2 cube -3 -3 cube -2 -3 cube -1 -3 cube 0 -3 cube
 0 -2 cube 0 -1 cube 1 -1 cube 2 -1 cube 3 -1 cube 4 -1 cube
 5 -1 cube 6 -1 cube 7 -1 cube 8 -1 cube 
 9 -1 cube 10 -1 cube 11 -1 cube 12 -1 cube 
 1 -2 cube 2 -2 cube 3 -2 cube 4 -2 cube 5 -2 cube 6 -2 cube
/d 2.5 def
/colorfill { 0.84 1 0.84 setrgbcolor fill 0 1.0 0 setrgbcolor } def
-13 1 cube -13 2 cube -13 3 cube
-12 -2 cube -11 -2 cube -12 -1 cube -11 -1 cube
-12 0 cube -11 0 cube -12 1 cube -11 1 cube
-12 2 cube -11 2 cube -12 3 cube -11 3 cube
-12 4 cube -11 4 cube -11 5 cube -11 6 cube
 -10 6 cube -9 6 cube -8 6 cube -7 6 cube
 -9 7 cube -8 7 cube -7 7 cube -7 8 cube -6 8 cube
 -5 8 cube -4 8 cube -3 8 cube -2 8 cube -1 8 cube 0 8 cube
  1 8 cube  2 8 cube  3 8 cube  4 8 cube  5 8 cube 6 8 cube
 -4 9 cube -3 9 cube -2 9 cube -1 9 cube 0 9 cube
  1 9 cube  2 9 cube  3 9 cube  4 9 cube
  6 7 cube  6 6 cube 7 6 cube 8 6 cube 9 6 cube 10 6 cube 11 6 cube
 12 6 cube 13 6 cube 7 7 cube 8 7 cube 9 7 cube 10 7 cube 11 7 cube
 12 7 cube 13 7 cube 13 8 cube 14 8 cube 15 8 cube 16 8 cube 17 8 cube
 16 9 cube 17 9 cube 17 10 cube 18 10 cube 19 10 cube 20 10 cube
 21 10 cube 22 10 cube 23 10 cube 24 10 cube 25 10 cube 26 10 cube
 20 11 cube 21 11 cube 22 11 cube
 26 9 cube 27 9 cube 26 8 cube 27 8 cube 28 8 cube 28 7 cube 28 6 cube 
 28 5 cube 28 4 cube 28 3 cube 28 2 cube 28 1 cube 28 0 cube
 29 7 cube 29 6 cube 29 5 cube 29 4 cube 29 3 cube 29 2 cube 
 29 1 cube 29 0 cube
-12 -3 cube -11 -3 cube -10 -3 cube -9 -3 cube
-11 -4 cube -10 -4 cube -9 -4 cube
-10 -5 cube -9 -5 cube -8 -5 cube -7 -5 cube
 -9 -6 cube -8 -6 cube -7 -6 cube
 -7 -7 cube -6 -7 cube -5 -7 cube -4 -7 cube
 -3 -7 cube -2 -7 cube -1 -7 cube  0 -7 cube
 1 -7 cube 2 -7 cube 3 -7 cube 4 -7 cube 5 -7 cube 6 -7 cube
 2 -6 cube 3 -6 cube 4 -6 cube 5 -6 cube 6 -6 cube 7 -6 cube 8 -6 cube
 9 -6 cube 10 -6 cube 11 -6 cube
 2 -5 cube 3 -5 cube 4 -5 cube 5 -5 cube 6 -5 cube
 7 -5 cube 8 -5 cube 9 -5 cube 10 -5 cube 11 -5 cube
 12 -5 cube 13 -5 cube 14 -5 cube 15 -5 cube 16 -5 cube 17 -5 cube
 18 -5 cube 19 -5 cube
 14 -4 cube 15 -4 cube 16 -4 cube 17 -4 cube 18 -4 cube 19 -4 cube
 20 -4 cube 21 -4 cube 22 -4 cube 23 -4 cube 24 -4 cube
 14 -3 cube 15 -3 cube 16 -3 cube 17 -3 cube 18 -3 cube 19 -3 cube
 20 -3 cube 21 -3 cube 22 -3 cube 23 -3 cube 24 -3 cube 25 -3 cube
 26 -3 cube 26 -2 cube 26 -1 cube 27 -2 cube 27 -1 cube 28 -1 cube
 30 4 cube
grestore
  0.113 setlinewidth
  93.000 11.000 moveto  99.000 7.000 lineto stroke
}
\LabelTeX    16.200  46.500 $\Omega$\ELTX
\LabelTeX    35.000  24.000 $K_0$\ELTX
\LabelTeX   100.000   5.000 $K_p$\ELTX
\EndFig
\medskip
\centerline{{\bf Fig.~16.} Pavage exhaustif d'un ouvert $\Omega$ de $\bR^n$.}
\medskip
On cherche alors à définir
$$
\int_\Omega f(x)\,dx =\lim_{p\to+\infty}\int_{K_p} f(x)\,dx
\leqno(2.2)
$$
en supposant qu'il y a {\it convergence absolue}, c'est-à-dire
que la suite croissante d'inté\-grales $I_p=\smash{\int_{K_p}|f(x)|\,dx}$
reste bornée.  Comme le domaine $K_p $ est une réunion finie de pavés
d'intérieurs disjoints, l'intégrale sur $K_p$ est définie comme
la somme des intégrales sur ces pavés (et~cette somme est bien
indépendante du découpage choisi d'après la proposition
1.12).  Dans ce cas le critère de Cauchy montre que pour tout
$\varepsilon>0$ il existe un entier $p_0$ tel que pour $q\ge p\ge p_0$
on ait $0\le I_q-I_p\le\varepsilon$, donc
$$
\Big|\int_{K_q} f(x)\,dx - \int_{K_p} f(x)\,dx\Big| =
\Big|\int_{K_q\ssm K_p^\circ} f(x)\,dx\Big|\le
\int_{K_q\ssm K_p^\circ} |f(x)|\,dx\le\varepsilon\leqno(2.3)
$$
(le domaine $K_q\ssm K_p^\circ$ étant lui aussi réunion finie de pavés 
d'intérieurs disjoints). Si $K'_p$ est un autre pavage exhaustif, il existe
des indices $q(p)$ et $q'(p)$ tels que $K'_p\subset K_{q(p)}$ et
$K_p\subset K'_{q'(p)}$, donc $K_p\ssm(K_p\cap K'_p)\le
K'_{q'(p)}\ssm K'_p$ et $K'_p\ssm(K_p\cap K'_p)\le
K_{q(p)}\ssm K_p$, ce qui montre que la limite
$$
\lim_{p\to+\infty}\int_{K_p} f(x)\,dx=
\lim_{p\to+\infty}\int_{K_p\cap K'_p} f(x)\,dx=
\lim_{p\to+\infty}\int_{K'_p} f(x)\,dx
$$
ne dépend pas du pavage exhaustif choisi.

Dans ce qui suit, nous aurons besoin d'une autre forme de «\?découpage\?»,
à savoir la possibilité d'écrire $f$, sur tout
compact $K_p$, comme une somme finie $f=\sum f_j$ où les $f_j$ sont
continues et {\it à support compact} dans des cubes aussi petits que
l'on veut, contenus dans $\Omega$. Pour cela, on écrit par exemple 
que sur $\bR$
on a $1=\sum_{j\in\bZ}\theta(x-j)$ où $\theta$ est la fonction
sinusoïdale tronquée définie par
$$
\theta(x)=\cases{
\cos^2({\pi\over 2}x)&si $x\in[-1,1]$,\cr
\noalign{\vskip4pt}
0&si $x\in\bR\ssm [-1,1]$.\cr}
\leqno(2.4\,{\rm a})
$$
On a en effet $\theta(x-1)=\sin^2({\pi\over 2}x)$ si $x\in[0,2]$, et donc
$\theta(x)+\theta(x-1)=1$ sur $[0,1]$.

\InsertFig 15.000 42.000 {
1 mm unit
-15.000  10.000 moveto  130.000   0.000 2.4 vector
 50.000   0.000 moveto   37.000  90.000 2.4 vector
  0.339 setlinewidth
/theta {
 10.000  10.000 moveto
[ 10.000  10.000  30.000  10.000  30.050  10.000 50.000  30.000 
  69.950  10.000  70.000  10.000  90.000  10.000 ] curve stroke } def
  0.000   0.000   0.000 setrgbcolor
  theta
  1.000   0.000   0.000 setrgbcolor
 20.000   0.000 translate theta
  0.000   0.000   1.000 setrgbcolor
-40.000   0.000 translate theta
  0.000 setgray
 40.000  10.000 moveto  0.7  0 indent
 60.000  10.000 moveto  0.7  0 indent
  0.113 setlinewidth
 [ 1 0.5 ] 0 setdash
 40.000  11.200 moveto  40.000  20.000 lineto stroke
 60.000  11.200 moveto  60.000  20.000 lineto stroke
}
\LabelTeX 113.500  6.000 $x$\ELTX
\LabelTeX  46.000 35.700 $y$\ELTX
\LabelTeX  55.000 29.000 $\theta(x)$\ELTX
\LabelTeX  75.000 29.000 $\RGBColor{1 0 0}{\theta(x-1)}$\ELTX
\LabelTeX  12.000 29.000 $\RGBColor{0 0 1}{\theta(x+1)}$\ELTX
\LabelTeX   7.500  6.000 $-2$\ELTX
\LabelTeX  27.500  6.000 $-1$\ELTX
\LabelTeX  37.500  6.000 $-{1\over 2}$\ELTX
\LabelTeX  47.500  6.000 $0$\ELTX
\LabelTeX  59.200  6.000 ${1\over 2}$\ELTX
\LabelTeX  69.200  6.000 $1$\ELTX
\LabelTeX  89.200  6.000 $2$\ELTX
\EndFig
\smallskip
\centerline{{\bf Fig.~17.} Découpage par des fonctions continues à 
support compact.}
\medskip

En $n$ variables on écrit que $\prod_{1\le k\le n}\big(\sum_{j_k\in\bZ}
\theta(x_k-j_k)\big)=1$. Après une homothétie de rapport assez petit 
$2^{-t_p}$, ceci donne l'analogue en dimension $n$, à savoir que pour
$j=(j_1,\ldots,j_n)\in\bZ^n$ et $x=(x_1,\ldots,x_n)
\in\bR^n$ on a
$$
\sum_{j\in\bZ^n}\theta_{j,p}(x)=1\qquad\hbox{avec}\quad
\theta_{j,p}(x)=\prod_{1\le k\le n}\theta(2^{t_p}x_k-j_k).\leqno(2.4\,{\rm b})
$$
Il est facile de voir que $\theta_{j,p}$ est à support dans le cube fermé 
$C_{j,p}$ de centre $2^{-t_p}j$ et de côté $2^{1-t_p}$.
Alors $f=\sum_{j\in\bZ^n}f\theta_{j,p}$ et 
$f\theta_{j,p}$ est à support dans $C_{j,p}$. Si on restreint la somme à 
l'ensemble $J_p$ des indices $j$ correspondant aux cubes $C_{j,p}$
contenus dans $\Omega\cap[-2^{t_p},2^{t_p}]^n$, alors on obtient une fonction
continue à support compact $f\chi_p$, avec 
$\chi_p=\sum_{j\in J_p}\theta_{j,p}$, $0\le\chi_p\le 1$, $\chi_p$
égale à  $1$ sur $K_p$ pour $t_p\in\bN$ assez grand. 
Dans ces conditions, nous avons
$$
\int_\Omega f(x)\,dx=\lim_{p\to+\infty} \int_\Omega f(x)\chi_p(x)\,dx=
\lim_{p\to+\infty}\sum_{j\in J_{p}}
\int_{C_{j,p}}f(x)\theta_{j,p}(x)\,dx.\leqno(2.5)
$$

{\bf (2.6) Formule du changement de variable dans $\bR^n$.} {\it 
Soit $\varphi:\Omega\to\Omega'$ une bijection de classe 
$C^1$ entre deux ouverts de $\bR^n$, telle que le 
«\?déterminant jacobien\?»
$$
\boxed{16}{
\Jac\varphi(x)=\det\bigg({\partial\varphi_i\over\partial x_j}
\bigg)_{1\le i,j\le n}}
$$
soit partout non nul. Alors pour toute fonction continue
$f:\varphi(\Omega)=\Omega'\to\bR$ d'intégrale abso\-lument convergente sur 
$\varphi(\Omega)$ on a
$$
\boxed{16}{
\int_{\varphi(\Omega)}f(y)\,dy=\int_{\Omega}f(\varphi(x))\,
|\Jac\varphi(x)|\,dx}
$$
et l'intégrale du membre de droite est absolument convergente
sur $\Omega$.}

Dans la pratique on pose $y=\varphi(x)$, et on écrit que les éléments de
volume se transforment par la formule $dy=|\Jac\varphi(x)|\,dx$.

{\it Démonstration.} En dimension $1$ et dans le cas d'un intervalle
$\Omega={}]a,b[{}\subset\bR$, la~for\-mule se réduit à celle obtenue
en (4.5) avec $|\Jac\varphi(x)|=|\varphi'(x)|\,$; la valeur absolue
provient de ce qu'on ne tient pas compte de l'ordre des bornes pour
l'intervalle image $\varphi(]a,b[)$.  Pour obtenir le cas général
en dimension quelconque, l'idée est la suivante~: tout changement de 
variable peut s'obtenir comme une composition de changements de variables
dans lesquels on change une seule coordonnée à la fois, et dans ce cas,
la preuve se ramène au cas élémentaire d'une seule variable à l'aide
du théorème de 
Fubini\note{14}{Bien entendu, il pourra éventuellement être judicieux,
dans un premier temps, de ne donner la preuve qu'en dimension~$2$, ce qui
permet de simplifier les notations. Curieusement, le fait que 
l'on puisse ramener la preuve
de la formule du jacobien à la dimension~$1$ par des manipulations
purement algébriques semble ne pas être «\?passé dans les 
moeurs\?», de sorte que les livres traitant de l'intégration 
développent souvent des démonstrations analytiques nettement plus 
élaborées. Celles-ci consistent en général à faire des approximations
linéaires uniformes modulo des versions effectives adéquates du 
théorème d'inversion locale, en énonçant d'abord la formule du
déterminant pour le cas d'un changement linéaire.
Ceci apparaîtra en fait plutôt comme une conséquence du résultat
général dans la présente approche, qui contient le cas linéaire comme
cas très particulier (cf.\ remarque 2.6).}. Pour cela, on procède en 
plusieurs étapes.

{\it Première étape.} On considère le cas particulier d'un 
changement de variable
$$
x=(x_1,\ldots,x_n)\build\longmapsto^\varphi_{}y=
(u(x_1,\ldots,x_n),x_2,\ldots,x_n)
$$
portant uniquement sur la première coordonnée, avec $x$ dans
un pavé $P=\prod[a_i,b_i]$ et $x_1\mapsto u(x_1,\ldots,x_n)$
strictement monotone sur $[a_1,b_1]$. On écrit pour simplifier 
\hbox{$x=(x_1,x')$} avec $x'=(x_2,\ldots,x_n)$, donc
$y=\varphi(x)=(u(x),x')$. On suppose en outre que la fonction $f$
à intégrer est à {\it support compact} dans l'image $\varphi(P^\circ)$
du pavé ouvert~$P^\circ$, de sorte que $f\circ\varphi$ est nulle au 
voisinage du bord $\partial P$ et sur le complémentaire~$\complement P$. 
Nous avons
$$
\varphi(P)\subset Q\quad\hbox{avec
$Q=[m,M]\times P'$,~ $m=\min_P u$,~ $M=\max_Pu$,~
$P'=\prod_{i\ge 2}[a_i,b_i]$}.
$$
Il revient au même d'intégrer $f$ sur l'ouvert image
$\varphi(P^\circ)$ ou sur le pavé $Q$, puisque $f$ est nulle par
hypothèse sur $Q\ssm\varphi(P^\circ)$. On obtient par conséquent
$$\leqalignno{
\int_{\varphi(P^\circ)}f(y)\,dy=\int_Qf(y)\,dy
&=\int_{P'}\bigg(\int_m^M f(y_1,y')\,dy_1\bigg)dy'\cr
&=\int_{P'}\!\!\bigg(\int_m^M f(y_1,x')\,dy_1\bigg)dx'&(2.6\,{\rm a})\cr}
$$
à l'aide du théorème de Fubini et du changement de variable 
trivial $y'=x'$. Effectuons dans l'intégrale en $dy_1$ le changement
$x_1\mapsto y_1=u(x)=u(x_1,x')$. Comme la fonction
$y_1\mapsto f(y_1,x')$ est nulle
en dehors de l'intervalle image $[u(a_1,x'),u(b_1,x')]$, il vient
par le théorème de changement de variable en dimension $1$
$$
\eqalign{
\int_m^M
f(y_1,x')\,dy_1
&=\varepsilon\int_{u(a_1,x')}^{u(b_1,x')}f(y_1,x')\,dy_1=
\varepsilon\int_{a_1}^{b_1}
f(u(x),x')\,{\partial u\over\partial x_1}(x)\,dx_1\cr
&=\int_{a_1}^{b_1}
f(u(x),x')\,\bigg|{\partial u\over\partial x_1}(x)\bigg|\,dx_1,\cr}
$$
avec $\varepsilon=+1$ si $u$ est croissante en $x_1$ et $\varepsilon=-1$
si $u$ est décroissante en $x_1$. On a donc
$$
\leqalignno{
\int_{P'}\bigg(\int_m^M f(y_1,x')\,dy_1\bigg)dx'
&=\int_{P'}\bigg(\int_{a_1}^{b_1}
f(u(x),x')\,\bigg|{\partial u\over\partial x_1}(x)\bigg|\,dx_1\bigg)dx'\cr
&=\int_P f(u(x),x')\,
\bigg|{\partial u\over\partial x_1}(x)\bigg|\,dx&(2.6\,{\rm b})\cr}
$$
en appliquant de nouveau le théorème de Fubini. Compte tenu du
fait évident que $\varphi:x\mapsto (u(x),x_2,\ldots,x_n)$ a pour jacobien 
$\Jac\varphi=\partial u/\partial x_1$, la combinaison de
(2.6$\,$a) et (2.6$\,$b) donne bien l'égalité attendue
$$
\int_{\varphi(P^\circ)}f(y)\,dy=
\int_P f(u(x),x')\,\bigg|{\partial u\over\partial x_1}(x)\bigg|\,dx
=\int_{P^\circ} f(\varphi(x))\,|\Jac\varphi(x)|\,dx.
$$

{\it Deuxième étape.} On suppose ici que le changement de variable 
$x\mapsto y=\varphi(x)$ est de la forme
$$
x=(x_1,\ldots,x_n)\build\longmapsto^{\varphi}_{}
y=(\varphi_1(x),\ldots,\varphi_r(x),x_{r+1},\ldots,x_n)
\leqno(2.6\,{\rm c})
$$
pour un certain $r\ge 1$ (c'est-à-dire que $\varphi_i(x)=x_i$ pour
$i\ge r+1\,$; bien entendu, pour $r=n$, il s'agit d'un changement de variable
complètement général). On montre dans ce cas par récurrence sur $r$
que $\varphi$ est, localement au voisinage de tout point $a\in\Omega$, de 
la forme
\hbox{$\varphi=\sigma\circ\psi_1\circ\ldots\circ\psi_r$}
où $\sigma$~est une permutation des coordonnées $(x_1,\ldots,x_n)$
qui permute $(x_1,\ldots,x_r)$ et laisse invariantes
$(x_{r+1},\ldots,x_n)$, et où $\psi_i$ est un changement de variable 
local agissant sur la seule variable~$x_i$~:
$$
x=(x_1,\ldots,x_n)\build\longmapsto^{\psi_i}_{}
y=(x_1,\ldots,x_{i-1},u_i(x),x_{i+1},\ldots,x_n).
\leqno(2.6\,{\rm d})
$$
(ceci revient à dire qu'un changement de variable tel que (2.6$\,$c)
s'obtient en changeant les coordonnées $x_1,\ldots,x_r$ une par une, 
successivement). 
Si $r=1$, le résultat est évident avec $\sigma=\Id$, $u_1=\varphi_1$, 
$\varphi=\psi_1=\sigma\circ\psi_1$. Supposons maintenant $r\ge 2$ et soit 
$a\in\Omega$. Comme
$$
\Jac\varphi(a)=\det\bigg({\partial\varphi_i\over\partial x_j}(a)
\bigg)_{1\le i,j\le r}\ne 0,
$$
on voit que l'une des dérivées $\partial\varphi_i/\partial x_r(a)$ est
non nulle. Quitte à remplacer $\varphi$ par 
\hbox{$\varphi^\theta=\theta\circ\varphi$} avec une permutation 
$\theta$ adéquate des coordonnées $(y_1,\ldots y_r)$,
on peut supposer que $\partial\varphi^\theta_r/\partial x_r(a)\ne 0$. On 
considère
alors le changement de variable $\psi_r$ défini par (2.6$\,$d) avec
$u_r(x)=\varphi^\theta_r(x)$. Comme le jacobien de $\psi_r$ en $a$ est égal 
à \hbox{$\partial\varphi^\theta_r/\partial x_r(a)\ne 0$}, le~théorème
d'inversion locale montre que $\psi_r$ est
bien un changement de variable inversible au voisinage de $a$. De plus,
$\tilde\varphi=\varphi^\theta\circ \psi_r^{-1}$
est de la forme (2.6$\,$c) à l'ordre $r-1$ au voisinage de $b=\psi_r(a)$,
puisque si $y=\psi_r(x)$ alors $z=\tilde\varphi(y)=\varphi^\theta(\psi_r^{-1}(y))=
\varphi^\theta(x)$ est tel que
$z_i=x_i=y_i$ pour $i\ge r+1$ tandis que $z_r=\varphi^\theta_r(x)=y_r$.
On peut donc écrire par hypothèse de récurrence
$$
\tilde\varphi=\tilde\sigma\circ\tilde\psi_1\circ\ldots\circ\tilde\psi_{r-1}
$$
au voisinage de $b$, ce qui entraîne que
$$
\varphi=\theta^{-1}\circ\varphi^\theta=
\theta^{-1}\circ\tilde\varphi\circ\psi_r=
(\theta^{-1}\circ\tilde\sigma)\circ\tilde\psi_1\circ\ldots
\circ\tilde\psi_{r-1}\circ\psi_r
$$
est de la forme voulue au voisinage de $a$.

{\it Troisième étape.} On montre ici que si la formule est vraie pour 
les changements de variables $\varphi$ et $\psi$, alors elle est encore 
vraie pour le changement de variable composé 
$$
\psi\circ\varphi~:~~x\mapsto y=\varphi(x) \mapsto z=\psi(y),
$$
chaque fois que $\varphi:\Omega\to\Omega'$ et $\psi:\Omega'\to\Omega''$ 
sont des bijections de classe $C^1$  ayant des jacobiens non nuls. 
Sous cette hypothèse $\psi\circ\varphi:\Omega\to\Omega''$ a les mêmes
propriétés, et comme 
$(\psi\circ\varphi)'=(\psi'\circ\varphi)\cdot\varphi'$, 
on~a $\Jac(\psi\circ\varphi)=((\Jac\psi)\circ\varphi)\times\Jac\varphi$.
En posant $g(y)=f(\psi(y))\,|\Jac\psi(y)|$, on trouve successivement
$$
\int_{\psi(\varphi(\Omega))}f(z)\,dz
=\int_{\varphi(\Omega)}g(y)\,dy=
\int_{\Omega}g(\varphi(x))\,|\Jac\varphi(x)|\,dx,
$$
et on a bien
$$
g(\varphi(x))\,|\Jac\varphi(x)|=
f(\psi(\varphi(x)))\,|\Jac\psi(\varphi(x))|\,|\Jac\varphi(x)|
=f(\psi\circ\varphi(x))\,|\Jac\psi\circ\varphi(x)|.
$$

{\it Quatrième étape.} On démontre ici la version locale de la
formule, à savoir sa validité, pour tout point $y_0$ de $\Omega$,
lorsque $f$ est à support compact dans un voisinage $V$ assez petit de
$y_0$.  Dans ce cas $f\circ\varphi$ est à support compact dans
$U=\varphi^{-1}(V)$ qui est un voisinage de $x_0=\varphi^{-1}(y_0)$.
Lorsque $U$ et $V$ sont assez petits, on sait d'après la deuxième
étape qu'on peut écrire $\varphi$ sur $U$ comme la composée
$\varphi=\sigma\circ\psi_1\circ\ldots\circ\psi_n$ d'une permutation
$\sigma$ de coordonnées et de changements $\psi_i$ portant sur une
seule des variables. Puisque la formule de changement de variable est
vraie trivialement pour $\sigma$ et pour chaque $\psi_i$ (étape 1),
elle est vraie pour $\varphi$ d'après la troisième étape. Pour justifier
cela de façon précise, on s'arrange pour trouver successivement
des pavés $P_0$, $P_1$, $\ldots$, $P_n$ assez petits pour que $\psi_i$ soit 
définie sur~$P_i$, avec $\psi_i(P_i)\subset P_{i-1}$ pour tout $i$, et on
prend $U=P_n^\circ$, $V=\varphi(U)$.

{\it Cinquième étape.} La formule est vraie en toute 
généralité, lorsque $f$ est continue sur~$\Omega'$ et d'intégrale 
absolument convergente. Pour cela, on utilise un découpage de $\Omega'$
en cubes assez petits, et la formule (2.5) qui donne
$$
\int_{\Omega'}f(y)\,dy=
\lim_{p\to+\infty}\sum_{j\in J_{p}}
\int_{C_{j,p}}f_{j,p}(y)\,dy
$$
avec $f_{j,p}=f\theta_{j,p}$ continue à support compact dans $C_{j,p}$.
Lorsque le découpage est assez fin, la quatrième étape donne
$$
\int_{C_{j,p}}f_{j,p}(y)\,dy = \int_{\Omega'}f_{j,p}(y)\,dy =
\int_\Omega f_{j,p}(\varphi(x))\,|\Jac \varphi(x)|\,dx
$$
Avec les notations de (2.5) et après sommation sur $j$ il vient
$\sum_{j\in J_p}f_{j,p}=f\chi_p$, d'où
$$
\int_{\Omega'}f(y)\chi_p(y)\,dy =
\int_{\Omega}f(\varphi(x))\chi_p(\varphi(x))\,|\Jac \varphi(x)|\,dx.
$$
Comme les intégrales sont absolument convergentes et que
$f=\lim_{p\to+\infty} f\chi_p$ avec $0\le \chi_p\le 1$ et $\chi_p=1$ sur
$K_p$, nous obtenons après passage à la limite la formule de changement
de variable cherchée~(2.6).\qed
\medskip

{\bf (2.7) Remarque.} Un cas très particulier de la formule de
changement de variable est celui où la transformation
$\varphi:x\mapsto Ax$ est linéaire, définie par une matrice
inversible~$A$. Dans ce cas, la formule de changement de variable
s'écrit $y=Ax$, $dy=|\det A|\,dx$ et on trouve donc
$$
\boxed{16}{
\int_{A(\Omega)}f(y)\,dy=\int_{\Omega}f(Ax)\,|\det A|\,dx.}
\leqno(2.7\,{\rm a})
$$
La preuve est bien entendu un cas particulier de ce qui précède, mais elle
peut aussi s'obtenir de manière directe comme ci-dessus en observant que 
$A$ est un produit de matrices élémentaires de la forme
$$
D_i(\lambda)=\pmatrix{
1&0&\ldots&0\cr
0&\lambda&\ldots&0\cr
\vdots&&&\vdots\cr
0&0&\ldots&1\cr},\qquad
A_{ij}(\mu)=\pmatrix{
1&0&\ldots&0&\ldots&0\cr
0&1&\ldots&\mu&\ldots&0\cr
\vdots&&&&&\vdots\cr
0&0&\ldots&0&\ldots&1\cr}.
$$
En effet, celles-ci fournissent des changements de variables qui ne modifient 
qu'une seule des coordonnées à la fois~:
$$
D_i(\lambda)~:~~x_i\mapsto x'_i=\lambda x_i,\qquad A_{ij}(\mu):
x_i\mapsto x'_i=x_i+\mu x_j.
$$
En appliquant la formule $(2.7\,{\rm a})$ à la fonction constante 
$f(x)=1$, on obtient la formule usuelle de transformation du volume
$$
\boxed{12}{
\vol(A(\Omega))=|\det A|\,\vol(\Omega).}
\leqno(2.7\,{\rm b})
$$
Dans le cas encore plus particulier où $\Omega$ est le cube unité, on voit
que le volume du paral\-lélogramme $\Pi_{a_1,\ldots,a_n}
=\{\sum x_i a_i,\,0\le x_i\le 1\}$ 
engendré par les vecteurs colonnes $(a_1,\ldots,a_n)$ de la matrice $A$ 
est donné par
$$
\boxed{12}{
\vol(\Pi_{a_1,\ldots,a_n})=\big|\det(a_1,\ldots,a_n)\big|.}
\leqno(2.7\,{\rm c})
$$
La formule 2.7$\;$(c) peut 
s'obtenir de manière élémentaire comme suit~: d'une part les matrices 
$D_i(\lambda)$ dilatent les volumes dans le facteur 
$|\lambda|=|\det(D_i(\lambda))|$, d'autre part les «\?transvections\?»\
$A_{ij}(\mu)$ (qui sont de déterminant $1$ et qui envoient les
pavés rectangulaires sur des parallélépipèdes) ne modifient pas 
les volumes.
Ceci peut se voir directement à partir de la définition de l'intégrale 
et de l'invariance du volume par translation, en observant le schéma usuel
bien connu depuis l'enseignement primaire~:

\InsertFig  2.500 37.000 {
1 mm unit
  0.339 setlinewidth 
  0.000  10.000 moveto   40.000  30.000 rectangle stroke
 85.000  10.000 moveto  125.000  10.000 lineto
115.000  30.000 lineto   75.000  30.000 lineto closepath stroke
  0.113 setlinewidth
[ 1.000   0.500 ] 0 setdash
 85.000  10.000 moveto   85.000  30.000 lineto stroke
125.000  10.000 moveto  125.000  30.000 lineto 
115.000  30.000 lineto  stroke
}
\LabelTeX  17.000  6.000 $\Omega$\ELTX
\LabelTeX  97.000  6.000 $\varphi(\Omega)$\ELTX
\LabelTeX  50.000 26.000 $\varphi=A_{ij}(\mu)$\ELTX
\LabelTeX  43.000 16.000 
$\displaystyle\pmatrix{x_1\cr x_2\cr}\mapsto
\pmatrix{x_1+\mu x_2\cr x_2\cr} $\ELTX
\EndFig
\vskip-8pt
\centerline{{\bf Fig.~18.} Invariance de l'aire et du volume par translation.}
\medskip
(Le schéma figuré ici correspond au choix $i=1$, $j=2$, $\mu=-1/2$).
\note{15}{Une fois qu'on en est arrivé à ce point, c'est-à-dire
en supposant acquise la formule (2.7$\,$c) par une voie directe,
voici l'autre approche possible de la preuve du théorème de
changement de variable~2.6 (peut-être plus classique 
que celle que nous avons suivie)~: elle consiste à utiliser une approximation
du changement de variable $\varphi$ par son application
linéaire tangente, combinée à des estimations de la distorsion
non linéaire relativement à des découpages en pavés suffisamment fins. 
Au total, la démonstration n'est pas nécessairement plus simple que 
celle «\?purement algébrique\?» que 
nous avons adoptée, puisque des estimations
analytiques sont nécessaires.}
\bigskip

\section{3. Intégration des formes différentielles et formule de Stokes}

L'objet de ce paragraphe est d'introduire la théorie de
l'intégration sur les courbes, surfaces ou plus généralement sur
les sous-variétés quelconques tracées dans~$\bR^n$. L'outil
fondamental est la notion de forme différentielle et le calcul
différentiel «\?extérieur\?» qui lui est
associé. Plutôt que de viser à la généralité la plus
grande possible, nous essaierons d'introduire les notions fondamentales
de manière concise, en nous concentrant sur les méthodes de calcul
et les principales formules.

Étant donné une fonction $f$ de classe $C^k$ sur un ouvert
$\Omega$ de $\bR$ ($k\ge 1$), on lui associe sa différentielle
$df=\sum_{1\le j\le n}{\partial f\over \partial x_j}dx_j$, 
qui est une application
$$
df:\Omega\times\bR^n\to\bR,\qquad(x\,;h)\mapsto df(x\,;h)=
\sum_{1\le j\le n}{\partial f\over \partial x_j}h_j,\leqno(3.1)
$$
de classe $C^{k-1}$ par rapport à la variable $x=(x_1,\ldots,x_n)\in\Omega$ 
et linéaire par rapport à $h=(h_1,\ldots,h_n)\in\bR^n$. En particulier 
la fonction coordonnée $f(x)=x_j$ 
a bien comme différentielle la forme linéaire $dx_j(h)=h_j$ (indépendante
du point $x\in\bR^n$, et $(dx_1,\ldots,dx_n)$ constitue une base de
l'espace $\cL(\bR^n,\bR)$ des formes linéaires sur $\bR^n$. De manière
générale, on introduit la notion de forme différentielle de degré $1$
comme suit.\medskip

{\bf (3.2) Définition.} {\it On appelle forme différentielle de degré $1$
et de classe $C^k$ sur l'ouvert $\Omega\subset\bR^n$ toute
application
$$
\alpha:\Omega\times\bR^n\to\bR,\qquad (x\,;h)\mapsto \alpha(x\,;h)
$$
de classe $C^k$ en $x$ et linéaire par rapport à la variable $h$. Une
telle application peut donc s'écrire sous la forme
$$
\alpha(x\,;h)=\sum_{1\le j\le n}\alpha_j(x)\,h_j\quad\hbox{ou encore}\quad
\alpha=\sum_{1\le j\le n}\alpha_j(x)\,dx_j,
$$
avec des coefficients $\alpha_j(x)$ qui sont des fonctions de classe $C^k$.}
\medskip
En dimension $1$, une forme différentielle s'écrit
$\alpha=f(x)\,dx$, et on lui associe son intégrale sur un intervalle
$[a,b]\subset\bR$ en posant simplement $\int_{[a,b]}\alpha=\int_a^bf(x)\,dx$.
L'{\it élément différentiel de longueur} est donné quant à lui par
$$
d\ell(h)=\Vert h\Vert=\sqrt{\sum_{1\le i\le n}h_i^2}=
\sqrt{\sum_{1\le i\le n}dx_i(h)^2},\qquad\hbox{soit}\quad
\boxed{18}{d\ell=\sqrt{\sum_{1\le i\le n}dx_i^2}.}
$$
Il ne s'agit pas d'une forme différentielle puisque
$d\ell(\lambda h)=|\lambda|\,d\ell(h)$ pour tout scalaire $\lambda\in\bR$
et qu'on n'a donc pas linéarité en $h$.
\medskip

{\bf (3.3) Intégrales curvilignes.} Si $\alpha=\sum_{1\le j\le n}
\alpha_j(x)\,dx_j$ est une forme différentielle continue sur un ouvert
$\Omega\subset\bR^n$, et 
$$
g:[a,b]\to\Omega,\qquad t\mapsto x=g(t)=(g_1(t),\ldots,g_n(t))
$$
un chemin de classe $C^1$ (ou $C^1$ par morceaux) tracé dans~$\Omega$, on
peut considérer l'expression différentielle $g^*\alpha$ obtenue par
la substitution $x_j=g_j(t)$ dans $\alpha(x)$, à savoir
$$
g^*\alpha=\sum_{1\le j\le n}\alpha_j(g(t))\,g'_j(t)\,dt.
$$
Si $[g]^+$ désigne le chemin $g$ orienté dans le sens des paramètres 
croissants (avec $a<b$), on définit l'intégrale curviligne de
$\alpha$ sur $[g]^+$ par
$$
\boxed{18}{
\int_{[g]^+}\alpha=\int_a^bg^*\alpha=
\int_a^b\sum_{1\le j\le n}\alpha_j(g(t))\,g'_j(t)\,dt}
\leqno(3.3\,{\rm a})
$$
et la longueur du chemin $g$ par
$$
\boxed{18}{
\longueur(g)=
\int_{[g]^+}d\ell=\int_a^b\sqrt{\sum_{1\le j\le n}g'_j(t)^2}\,dt.}
\leqno(3.3\,{\rm b})
$$
Il résulte de la formule de changement de variable (3.5) que
ces intégrales ne dépendent pas de la paramétrisation, 
c'est$\,$-$\,$à$\,$-$\,$dire 
qu'elles sont inchangées si on remplace\break \hbox{$g:[a,b]\to\Omega$} par
$g\circ\varphi:[a',b']\to\Omega$ où $\varphi:[a',b']\to[a,b]$ est un 
$C^1$-difféomorphisme (on doit supposer en outre $\varphi$ strictement 
croissant  dans le cas de (3.3$\,$a), si on ne veut pas avoir à modifier
l'ordre croissant des bornes).
Un cas particulier important est celui où la forme $\alpha$ est la
différentielle $\alpha=df$ d'une fonction $f$ de classe $C^1$ dans $\Omega$.
Dans ce cas $\alpha_j=\partial f/\partial x_j$ et 
$$
g^*(df)=
\sum_{1\le j\le n}{\partial f\over\partial x_j}(g(t))\,g'_j(t)\,dt=
(f\circ g)'(t)\,dt,
$$
d'où la formule fondamentale
$$
\boxed{16}{\hbox{si $g:[a,b]\to\Omega$},\qquad
\int_{[g]^+}df=\int_a^bg^*(df)=f(g(b))-f(g(a)),}
\leqno(3.3\,{\rm c})
$$
et en particulier $\int_{[g]^+}df=0$ si le chemin est fermé
(i.e.\ $g(a)=g(b)$).\qed
\medskip

{\bf (3.4) Éléments différentiels de dimension supérieure à 1
(aires, volumes,$\,$...)} Comme le montre la formule
(2.7$\,$b), le déterminant, et aussi la valeur absolue du déterminant,
jouent un rôle important en dimension quelconque. En particulier,
si $u_1,\ldots,u_p\in\cL(\bR^n,\bR)$ sont des formes linéaires,
on introduit l'application notée\break \hbox{$u_1\wedge\ldots\wedge u_p:
(\bR^n)^p\to\bR$}, appelée {\it produit extérieur} de $u_1,\ldots,
u_p$, telle que
$$
\boxed{16}{
u_1\wedge\ldots\wedge u_p(h_1,\ldots,h_p)=
\det\big(u_i(h_j)\big)_{1\le i,j\le p}.}\leqno(3.4\,{\rm a})
$$
C'est une forme {\it $p$-linéaire alternée}, c'est-à-dire linéaire
en chaque $h_j$, $1\le j\le p$, et telle que 
$u_1\wedge\ldots\wedge u_p(h_{\sigma(1)},\ldots,h_{\sigma(p)})=
\sign(\sigma)
u_1\wedge\ldots\wedge u_p(h_1,\ldots,h_p)$,
pour toute permutation $\sigma\in\gS_p$. Il est clair que
$u_1\wedge\ldots\wedge u_p=0$ si deux des formes 
$u_i$ coïncident, ou plus généralement si
les formes $u_i$ sont linéairement dépendantes. On~a de plus
$u_{\sigma(1)}\wedge\ldots\wedge u_{\sigma(p)}=\sign(\sigma)\,
u_1\wedge\ldots\wedge u_p$ pour tout $\sigma\in\gS_p$. En
particulier si $I=(i_1,\ldots,i_p)\in\{1,\ldots,n\}^p$ est un 
«\?multi-indice\?», on considère le
produit extérieur
$$\boxed{20}{
\eqalign{
&dx_I=dx_{i_1}\wedge\ldots\wedge dx_{i_p},\qquad\hbox{i.e.}\cr
\noalign{\vskip4pt}
&dx_I(h_1,\ldots,h_p)=
\det(dx_{i_k}(h_\ell))_{k,\ell}=\det(h_{i_k,\ell})_{k,\ell}
\cr}~~~\hbox{où}~~
h_\ell=\pmatrix{h_{1,\ell}\cr\vdots\cr h_{n,\ell}\cr},}
\leqno(3.4\,{\rm b})
$$
pour tous $h_1,\ldots,h_p\in\bR^n$. On a $dx_I\ne 0$ si et seulement si les
indices $i_k$ sont 2 à 2 distincts. Dans le cas d'une paire $I=(i,j)$
on trouve par exemple
$$
dx_i\wedge dx_j(h_1,h_2)=h_{i,1}h_{j,2}-h_{i,2}h_{j,1}.
\leqno(3.4\,{\rm c})
$$
D'après la formule (2.7$\,$c), la valeur absolue
$\big|dx_{i_1}\wedge\ldots\wedge dx_{i_p}(h_1,\ldots,h_p)\big|$
représente l'aire $p$-dimensionnelle du parallélogramme de $\bR^p$ 
construit sur les projections des vecteurs $h_1,\ldots,h_p\in\bR^n$ dans 
l'espace des coordonnées $(x_{i_1},\ldots,x_{i_p})\in\bR^p$.
Si $\alpha$ est une forme $p$-linéaire alternée et $(e_1,\ldots,e_n)$ la
base canonique de $\bR^n$, on pose 
$$
\alpha_I=\alpha_{(i_1,\ldots,i_p)}=\alpha(e_{i_1},\ldots,e_{i_p})\qquad
\hbox{pour $I=(i_1,\ldots,i_p)\in\{1,\ldots,n\}^p$},
\leqno(3.4\,{\rm d})
$$
ce qui permet d'écrire
$$
\alpha(h_1,\ldots,h_p)=\alpha\Big(\sum_{i_1=1}^n h_{i_1,1}e_{i_1},\ldots,
\sum_{i_p=1}^n h_{i_p,p}e_{i_p}\Big)=
\sum_{I\in\{1,\ldots,n\}^p}\alpha_Ih_{i_1,1}\ldots h_{i_p,p}.
$$
Comme $\alpha_I=0$ si deux des indices $i_k$ coïncident
et $\alpha_{(i_{\sigma(1)},\ldots,i_{\sigma(p)})}=\sign(\sigma)
\alpha_{(i_1,\ldots,i_p)}$ pour tout $\sigma\in\gS_p$, on peut regrouper
la sommation en fonction des muti-indices croissants $i_1<\ldots<i_p$
de $\{1,\ldots,n\}^n$, dont on note $\cC_p(n)$ l'ensemble. On trouve alors
$$
\alpha(h_1,\ldots,h_p)=
\sum_{I\in\cC_p(n)}\alpha_I\sum_{\sigma\in\gS_n}
\sign(\sigma)h_{i_{\sigma(1)},1}\ldots h_{i_{\sigma(p)},p}=
\sum_{I\in\cC_p(n)}\alpha_I\,dx_I(h_1,\ldots,h_p).
$$
On voit ainsi que $\alpha=\sum_{I\in\cC_p(n)}\alpha_I\,dx_I$ et que 
la famille $(dx_I)_{I\in\cC_p(n)}$ constitue une base
des formes $p$-linéaires alternées sur $\bR^n$.
\medskip

{\bf (3.5) Définition.} {\it Soit $\Omega$ un ouvert de $\bR^n$.
On appelle $p$-forme différentielle
$($ou forme différentielle de degré $p)$
et de classe $C^k$ sur l'ouvert $\Omega$ toute
application
$$
\alpha:\Omega\times(\bR^n)^p\to\bR,\qquad (x\,;h_1,\ldots,h_p)
\mapsto \alpha(x\,;h_1,\ldots,h_p)
$$
de classe $C^k$ telle que $(h_1,\ldots,h_p)\mapsto \alpha(x\,;h_1,\ldots,h_p)$
soit une forme $p$-linéaire alternée pour tout $x\in\Omega$. On peut donc 
l'écrire en coordonnées
$$
\boxed{12}{
\alpha=\sum_{I\in\cC_p(n)}\alpha_I(x)\,dx_I,}
$$
avec des coefficients $\alpha_I(x)$ qui sont des applications de classe $C^k$
sur $\Omega$, la somme étant prise sur l'ensemble $\cC_p(n)$
des multi-indices croissants $I=(i_1{<}...{<}i_p)$ de $\{1,\ldots,n\}^n$.}
\medskip

Nous allons avoir besoin d'une notion légèrement différente (et d'une
certaine façon plus générale). Cherchons en effet l'expression
algébrique de l'aire
euclidienne $p$-dimen\-sion\-nelle du parallélogramme porté par des 
vecteurs $h_1,\ldots,h_p\in\bR^n$ linéairement indépendants. On sait
d'après la formule (2.7$\,$c) que cette aire est la valeur absolue
du déterminant $|\det_{(a_1,\ldots,a_p)}(h_1,\ldots,h_p)|$ calculé
dans une base orthonormée $(a_1,\ldots a_p)$ du sous-espace
vectoriel $V$ engendré par $h_1,\ldots,h_p$, ce déterminant
étant bien indépendant au signe près du choix de la base
orthonormée. C'est donc la valeur absolue du déterminant
$\det(\Lambda)$ où $\Lambda=(\lambda_{ij})$ est la matrice $p\times
p$ des coefficients tels que $h_j=\sum_i\lambda_{ij}a_i$. Si $H$ et
$A$ sont les matrices $n\times p$ formées respectivement par les
vecteurs colonnes $(h_1,\ldots,h_p)$, $(a_1,\ldots,a_p)$, nous avons
$H=A\Lambda$ et donc le «\?déterminant de Gram\?» des
vecteurs $h_i$ vaut
$$
\det(h_i\cdot h_j)=\det({}^tHH)=\det({}^t\Lambda{}^tAA\Lambda)=
\det({}^t\Lambda\Lambda)=\det(\Lambda)^2
$$
puisque ${}^tAA=(a_i\cdot a_j)$ est la matrice unité. L'aire cherchée est
donc $(\det(h_i\cdot h_j))^{1/2}$, expression qui a le mérite de ne plus
dépendre du choix de la base orthonormée~$(a_i)$. Nous affirmons
que
$$
\det(h_i\cdot h_j)=\sum_{I\in\cC_p(n)}\big(dx_I(h_1,\ldots,h_p)\big)^2
\leqno(3.6)
$$
et plus généralement
$$
\det(h_i\cdot h'_j)=\sum_{I\in\cC_p(n)}dx_I(h_1,\ldots,h_p)\,
dx_I(h'_1,\ldots,h'_p)
\leqno(3.6')
$$
pour tous systèmes de $p$-uplets de vecteurs $(h_i)$, $(h'_j)$ de $\bR^n$.
En effet, comme l'expres\-sion $\det(h_i\cdot h'_j)$ est $p$-linéaire
alternée en
$(h_1,\ldots,h_p)$ et en $(h'_1,\ldots,h'_p)$, nous avons nécessai\-rement
une écriture de la forme
$$
\det(h_i\cdot h'_j)=\sum_{I,J\in\cC_p(n)}\beta_{I,J}\,dx_I(h_1,\ldots,h_p)\,
dx_J(h'_1,\ldots,h'_p)
$$
suivant la base $(dx_I)$, pour des coefficients $\beta_{I,J}$ adéquats. 
En prenant $(h_i)$ et $(h'_j)$ extraits de
la base canonique $(e_1,\ldots,e_n)$, on constate immédiatement que
\hbox{$\beta_{I,J}=1$} si $I=J$ et $\beta_{I,J}=0$ si $I\ne J$. Il résulte de
la formule (3.6) que l'aire eucli\-dienne \hbox{$p$-dimensionnelle} d'un 
$p$-uplet de vecteurs $(h_1,\ldots,h_p)$ est donnée
par l'élément différentiel 
$$
\boxed{18}{
dS=\sqrt{\sum_{I\in\cC_p(n)}dx_I^2}.}\leqno(3.7)
$$
En particulier, si $p=1$, on retrouve l'élément de longueur
$d\ell=\sqrt{\sum_{1\le i\le n}dx_i^2}$. L'expression (3.7) ne 
définit plus une $p$-forme différen\-tielle, mais ce 
qu'on appelle une \hbox{$p$-densité} différentielle~:
\medskip

{\bf (3.8) Définition.} {\it Soit $\Omega$ un ouvert de $\bR^n$.
On appelle $p$-densité différentielle de classe $C^k$ sur l'ouvert 
$\Omega$ toute application
$$
\alpha:\Omega\times(\bR^n)^p\to\bR,\qquad (x\,;h_1,\ldots,h_p)
\mapsto \alpha(x\,;h_1,\ldots,h_p)
$$
définie et de classe $C^k$ sur les $p$-uplets de vecteurs linéairement
indépendants, vérifiant en outre la
propriété
$$
\alpha(x\,;\Lambda(h_1,\ldots,h_p))=\big|\det(\Lambda)\big|\,
\alpha(x\,;h_1,\ldots,h_p)
$$
pour toute transformation par combinaison linéaire $(h_j)\mapsto
(\sum_i\lambda_{ij}h_i)$ des vecteurs~$h_i$ $($ce qui entraîne que
$\alpha(x\,;h_1,\ldots,h_p)$ est nulle sur des vecteurs $(h_i)$ non
linéairement indépendants$)$.}
\medskip
Si $\alpha_1,\ldots,\alpha_s$ sont des $p$-formes différentielles
et $f_1,\ldots,f_s$ sont des fonctions, il est clair~que
$$
\alpha=\sum_{1\le j\le s} f_j|\alpha_j|\quad\hbox{et}\quad
\beta=\sqrt{\sum_{1\le j\le s}\alpha_j^2}
$$
sont des $p$-densités différentielles. Lorsque $p=n$, tout $n$-uplet
$(h_1,\ldots,h_n)$ est l'image de la base canonique $(e_1,\ldots,e_n)$
par l'application linéaire $\Lambda$ dont la matrice est fournie par
les vecteurs colonnes $h_j$, et on voit que toute $n$-densité
différentielle $\alpha$ est donnée par
$$
\alpha(x\,;h_1,\ldots,h_n)=\big|\det(\Lambda)\big|\,
\alpha(x\,;e_1,\ldots,e_n)=f(x)\,\big|\det(h_1,\ldots,h_n)\big|
$$
en posant $f(x)=\alpha(x\,;e_1,\ldots,e_n)$, soit encore
$$
\alpha(x)=f(x)\,|dx_1\wedge\ldots\wedge dx_n|.\leqno(3.9)
$$
Nous introduisons maintenant les opérateurs algébro-différentiels
fondamentaux pour les formes différentielles.
\medskip

{\bf (3.10) Produit extérieur.} {\it Si $\alpha=\sum\alpha_I\,dx_I$ et
$\beta=\sum\beta_J\,dx_J$ sont des formes différentielles de
degrés respectifs $p$, $q$, on définit le produit extérieur
$\alpha\wedge\beta$ comme la forme différentielle de degré $p+q$
telle que
$$
\boxed{18}{
\alpha\wedge\beta=\sum_{I\in\cC_p(n),\,J\in\cC_q(n)}
\alpha_I\beta_J\,dx_{IJ}.}
$$}%
Autrement dit, on pose $dx_I\wedge dx_J=dx_{IJ}$,
ce terme étant nul si $I$ et $J$ ont des indices en commun~; de plus
$IJ$ n'est pas toujours ordonné -- même si $I$ et $J$ le sont -- il
faut donc éventuellement permuter et changer les signes des
coefficients pour se retrouver dans la base ordonnée croissante habituelle.
\medskip

On voit aussitôt que le produit extérieur est associatif et que l'on a
$$
\beta\wedge\alpha =(-1)^{pq}\alpha\wedge\beta\qquad
\hbox{si $p=\deg\alpha$,~ $q=\deg\beta$},\leqno(3.11)
$$
en particulier $\beta\wedge\alpha=-\alpha\wedge\beta$ si $\alpha$ et $\beta$
sont de degrés impairs.
\medskip

{\bf (3.12) Changement de variable.} {\it Soit $\alpha(x)=\sum\alpha_I(x)
\,dx_I$ une $p$-forme différen\-tielle sur un ouvert $\Omega\subset\bR$ et
$\varphi:\Omega'\to\Omega$, $t\mapsto x=\varphi(t)$ un «\?changement de
variable\?» de classe $C^1$ sur un ouvert $\Omega'$ de $\bR^m$. On appelle
image inverse de $\alpha$ par $\varphi$ la \hbox{$p$-forme} différentielle
sur $\Omega'$ notée $\beta=\varphi^*\alpha$,
obtenue par substitution de $x=\varphi(t)$ dans l'expression de $\alpha(x)\;:$
$$
\boxed{14}{
\varphi^*\alpha(t)=\sum \alpha_I(\varphi(t))\,d\varphi_I(t)=
\sum \alpha_I(\varphi(t))\,d\varphi_{i_1}(t)\wedge\ldots\wedge
d\varphi_{i_p}(t).}\leqno(3.12\,{\rm a})
$$
De manière alternative, c'est la forme 
$\varphi^*\alpha:\Omega'\times(\bR^m)^p\to\bR$ telle que
$$
\boxed{12}{
\varphi^*\alpha(t\,;h_1,\ldots,h_p)=
\alpha\big(\varphi(t)\,;\varphi'(t)(h_1),\ldots,\varphi'(t)(h_p)\big),}
\leqno(3.12\,{\rm b})
$$
obtenue en remplaçant $t\mapsto \varphi(t)$ via $\varphi$ et 
$h_i\mapsto\varphi'(t)(h_i)$ via l'application linéaire tangente
à~$\varphi$. Cette deuxième définition $(3.12{\rm b})$ est encore
valable pour une $p$-densité différentielle.
}
\medskip
Si on fait une deuxième substitution $t=\psi(u)$ avec 
$\psi:\Omega''\to\Omega'$,
il est clair que ceci est équivalent à substituer directement
$x=\varphi(t)=\varphi(\psi(u))=\varphi\circ\psi(u)$, donc on a
$$
\psi^*(\varphi^*\alpha)=(\varphi\circ\psi)^*\alpha.\leqno(3.13)
$$
Par ailleurs, l'opération de substitution est compatible avec le 
produit extérieur, c'est-à-dire que pour deux formes $\alpha$, $\beta$
sur $\Omega$ quelconques on a
$$
\varphi^*(\alpha\wedge\beta)=\varphi^*\alpha\wedge\varphi^*\beta.\leqno(3.14)
$$

{\bf (3.15) Différentiation extérieure.} {\it Si
$\alpha=\sum\alpha_I(x)\,dx_I$ est une $p$-forme différen\-tielle de
classe $C^k$, $k\ge 1$, on définit sa différentiation extérieure
comme la $(p+1)$-forme $d\alpha$ de classe $C^{k-1}$ telle que
$$
\boxed{18}{
d\alpha(x)=\sum_{I\in\cC_p(n)} d\alpha_I(x)\wedge dx_I=
\sum_{I\in\cC_p(n)}\sum_{\ell=1}^n {\partial\alpha_I(x)\over\partial x_\ell}
dx_\ell\wedge dx_I.}
$$
}

La première propriété essentielle est que 
$$
d^2\alpha=d(d\alpha)=0\qquad\hbox{pour toute forme $\alpha$ de classe $C^k$,
$k\ge 2$.}\leqno(3.16)
$$
En effet, un calcul direct donne
$$
\eqalign{
d(d\alpha)(x)
&=\sum_{I\in\cC_p(n)}\sum_{1\le k,\ell \le n} 
{\partial^2\alpha_I(x)\over\partial x_k\partial x_\ell}
dx_k\wedge dx_\ell\wedge dx_I\cr
&=\sum_{I\in\cC_p(n)}\sum_{1\le k<\ell \le n} 
\Big({\partial^2\alpha_I(x)\over\partial x_k\partial x_\ell}-
{\partial^2\alpha_I(x)\over\partial x_\ell\partial x_k}\Big)
dx_k\wedge dx_\ell\wedge dx_I\cr}
$$
en échangeant les rôles de $k$ et $\ell$ lorsque $k>\ell$ et en tenant 
compte du fait que $dx_\ell\wedge dx_k=-dx_k\wedge dx_\ell$, et
$dx_k\wedge dx_k=0$. Or le théorème de Schwarz implique que
$\partial^2\alpha_I(x)/\partial x_k\partial x_\ell=
\partial^2\alpha_I(x)/\partial x_\ell\partial x_k$ pour tous $k,\ell$.

On a par ailleurs la {\it formule de Leibnitz} de différentiation d'un 
produit extérieur
$$
d(\alpha\wedge\beta)=d\alpha\wedge\beta+(-1)^{\deg\alpha}\alpha\wedge d\beta
\leqno(3.17)
$$
pour toutes formes $\alpha,\,\beta$ de classe $C^1$. Ceci résulte
immédiatement du fait que $\alpha\wedge\beta=\sum_{I,J}\alpha_I\beta_J\,
dx_{IJ}$, et de la règle de Leibnitz usuelle $d(\alpha_I\beta_J)=
\alpha_Id\beta_J+\beta_J d\alpha_I$ pour les fonctions, appliquée aux 
coefficients de $\alpha\wedge\beta$. Enfin, la différentiation extérieure
{\it commute avec les changements de variable}~:
$$
d(\varphi^*\alpha)=\varphi^*(d\alpha)\qquad
\hbox{pour $\alpha,\,\varphi$ de classe $C^1$.}\leqno(3.18)
$$
Dans le cas d'une forme de degré $0$, c'est-à-dire d'une fonction 
$\alpha=f$, ceci signifie que $d(f\circ\varphi)=\varphi^*(df)$, or
$$
d(f\circ\varphi)(t\,;h)=(f\circ\varphi)'(t)(h)=f'(\varphi(t))
\big(\varphi'(t)(h)\big)=(df)\big(\varphi(t)\,;\varphi'(t)(h)\big)=
\varphi^*(df)(t\,;h)
$$
d'après la règle de différentiation des fonctions composées.
Le cas général en résulte grâce à (3.14, 3.16, 3.17)~:
si $\alpha=\sum\alpha_I\,dx_I$, on a $d(d\varphi_I)=
d(d\varphi_{i_1}\wedge \ldots\wedge d\varphi_{i_p})=0$ par (3.16) et (3.17),
tandis que (3.17) et (3.14) donnent
$$
\eqalign{
d(\varphi^*\alpha)&=d\Big(\sum(\alpha_I\circ\varphi)d\varphi_I\Big)
=\sum d(\alpha_I\circ\varphi)\wedge d\varphi_I
+(\alpha_I\circ\varphi)\wedge d(d\varphi_I)\cr
&=\sum d(\alpha_I\circ\varphi)\wedge d\varphi_I
=\sum \varphi^*(d\alpha_I)\wedge \varphi^*(dx_I)=\varphi^*(d\alpha).\cr}
$$

{\bf (3.19) Cas de la dimension 3.} Nous allons voir qu'en dimension $3$
le forma\-lisme du calcul différentiel extérieur rejoint (en le 
généralisant et en le simplifiant considérablement), le formalisme 
usuel de la physique mathématique. Soit $\Omega$ un ouvert de 
$\bR^3$. Si $f:\Omega\to\bR$
est une fonction de classe $C^1$, on lui associe son gradient 
$\ovr{\grad} f$ qui est par définition le champ de vecteurs 
sur $\Omega$ tel que
$$
df={\partial f\over\partial x}dx+
{\partial f\over\partial y}dy+{\partial f\over\partial z}dz
=\ovr{\grad}\,f\cdot \ovr{dM}\qquad
\hbox{où}~~
\ovr{\grad}\,f=\pmatrix{
\displaystyle{\partial f\over \partial x}\cr
\noalign{\vskip4pt}
\displaystyle{\partial f\over \partial y}\cr
\noalign{\vskip4pt}
\displaystyle{\partial f\over\partial z}\cr},~~
\ovr{dM}=\pmatrix{\displaystyle dx\cr \displaystyle dy\cr \displaystyle dz\cr}.
$$
Soit maintenant
$\ovr{V}:\Omega\to\bR^3$, $M\mapsto\ovr{V}(M)$ un champ de vecteurs de
classe $C^1$ arbitraire sur $\Omega$. On notera $M=(x,y,z)$ les coordonnées et
$\ovr{V}=(V_x,V_y,V_z)$ les composantes de $\ovr{V}$ dans la base
canonique. On peut de deux manières différentes associer une forme 
différentielle à ce champ de vecteurs. La première manière est de considérer
la $1$-forme de «\?{\it circulation infinitésimale}$\,$\?»\
du champ de vecteurs $\ovr{V}$~:
$$
\alpha=\ovr{V}(M)\cdot \ovr{dM}= V_xdx+V_ydy+V_zdz.
$$
La deuxième est d'introduire {\it l'élément de surface vectoriel} 
$\ovr{dS}$ défini comme le produit vectoriel euclidien
$$
\ovr{dS}(h,k)=\ovr h\wedge \ovr k=\pmatrix{
h_yk_z-h_zk_y\cr h_zk_x-h_xk_z\cr h_xk_y-h_yk_x\cr}
=\pmatrix{dy\wedge dz\cr dz\wedge dx\cr dx\wedge dy\cr}(\ovr h,\ovr k)
$$
c'est-à-dire 
$$
\ovr{dS}=\pmatrix{dy\wedge dz\cr dz\wedge dx\cr dx\wedge dy\cr}
$$
(on notera que $dS=\Vert\ovr{dS}\Vert$ est bien la densité d'aire
euclidienne d'après (3.7)). On peut alors considérer la $2$-forme
de «\?{\it flux infinitésimal}$\,$\?» du champ de vecteurs 
$\ovr{V}$~:
$$
\beta=\ovr{V}(M)\cdot \ovr{dS}=V_xdy\wedge dz +V_ydz\wedge dx+V_zdx\wedge dy.
$$
Un calcul immédiat donne
$$
d\alpha
=\Big({\partial V_y\over \partial z}-{\partial V_z\over \partial y}\Big)
dy\wedge dz+\Big({\partial V_z\over \partial x}-{\partial V_x\over \partial z}
\Big) dz\wedge dx+\Big({\partial V_x\over \partial y}-{\partial V_y\over
\partial x}\Big) dx\wedge dy,
$$
c'est-à-dire
$$
d\alpha=\ovr{\rot}\,\ovr{V}\cdot \ovr{dS}\qquad\hbox{où}\quad
\ovr{\rot}\,\ovr{V}=\pmatrix{\displaystyle 
{\partial V_y\over \partial z}-{\partial V_z\over \partial y}\cr
\noalign{\vskip3pt}\cr \displaystyle
{\partial V_z\over \partial x}-{\partial V_x\over \partial z}\cr
\noalign{\vskip3pt}\cr \displaystyle
{\partial V_x\over \partial y}-{\partial V_y\over \partial x}\cr}.
$$
On a enfin la formule
$$
d\beta=\Big({\partial V_x\over\partial x}+{\partial V_y\over\partial y}+
{\partial V_z\over\partial z}\Big)dx\wedge dy\wedge dz=\div\ovr{V}\,
dx\wedge dy\wedge dz
$$
où
$$
\div\ovr{V} = {\partial V_x\over\partial x}+{\partial V_y\over\partial y}+
{\partial V_z\over\partial z}.
$$
Ceci montre que le calcul de la différentielle extérieure $d\alpha$
pour des formes différentielles $\alpha$ de degré $0$, $1$, $2$
données respectivement par $f$, $\ovr{V}\cdot\ovr{dM}$, 
$\ovr{V}\cdot\ovr{dS}$ correspond au calcul de
$\ovr{\grad}f$, $\ovr{\rot}\,\ovr{V}$, $\div\ovr{V}$.
\medskip

{\bf (3.20) Intégration des densités différentielles sur une
nappe paramé\-trée.} Soit $\Omega$ un ouvert de $\bR^n$. On
suppose donnés un ouvert borné $U\subset\bR^p$ et une application
$g:\ovl U\to\Omega$, $t\mapsto x=g(t)$ de classe $C^k$ sur $\ovl U$,
$k\ge 1$. 

%%\InsertPSFile 0 50 70 70 {dgplot1_src.ps}
\InsertImage 8 50 0 47 1.0 0 {dgplot1.png}
\LabelTeX 18 25 $U\subset\bR^p$\ELTX
\LabelTeX 46  8 $g$\ELTX
\LabelTeX 92 41 $g(\ovl U)\subset\Omega\subset\bR^n$\ELTX
\EndFig
\vskip-10pt
$$
(t_1,t_2)\in[-\pi,\pi]\times[0,\pi]\longmapsto
\cases{
x_1=(2+\cos t_1)\,\cos(t_2)-0.055/(t_1^2+t_2^2+10^{-9})\cr
x_2=(2+\cos t_1)\sin t_2\cr
x_3=\sin t_1.\cr}
$$
\medskip
\centerline{{\bf Fig.~19.} Un exemple de nappe paramétrée (non injective).}
\medskip

On dira qu'une telle application définit une {\it nappe
paramétrée} de dimension $p$ et de classe $C^k$ dans
l'ouvert $\Omega$. Si $h:\ovl V\to\Omega$, $\tau\mapsto h(\tau)$ est
une autre nappe paramétrée, on dira que les nappes associées à 
$g$ et $h$ sont $C^k$-équivalentes s'il existe un
$C^k$-difféomorphisme $\varphi:\ovl U\to\ovl V$, $t\mapsto
\tau=\varphi(t)$ tel que $g=h\circ\varphi$. Il est aisé de vérifier
qu'il s'agit bien d'une relation d'équivalence. De plus, si 
$g\sim h$, les images $g(\ovl U)\subset\Omega$ et $h(\ovl V)\subset\Omega$
coïncident. On notera $[g]$ la classe d'équivalence de $g$.

Maintenant, si $x\mapsto \alpha(x)$ est une $p$-densité
différentielle à coefficients continus sur $\Omega$, on définit
$$
\boxed{16}{
\int_{[g]}\alpha=\int_U g^*\alpha.}\leqno(3.20\,{\rm a})
$$
Ici $g^*\alpha$ est le résultat de la substitution $x=g(t)$ dans $\alpha(x)$.
On obtient ainsi d'après (3.9) une expression de la forme
$g^*\alpha(t)=f(t_1,\ldots,t_p)\,|dt_1\wedge\ldots\wedge dt_p|$,
ce qui permet de poser par définition
$$
\boxed{16}{
\int_U g^*\alpha=\int_U f(t_1,\ldots,t_p)\,|dt_1\wedge\ldots\wedge dt_p|
=\int_U f(t_1,\ldots,t_p)\,dt_1\ldots dt_p.}\leqno(3.20\,{\rm b})
$$
Autrement dit, on confond dans les notations la $p$-densité 
$|dt_1\wedge\ldots\wedge dt_p|$ avec l'élément de volume 
$dt_1\ldots dt_p$ de $\bR^p$, ce qui paraît naturel compte tenu de la
formule (2.7$\,$c). Un point tout à fait essentiel est que l'intégrale 
(3.20$\,$b) est indépendante de la paramé\-trisation,
c'est-à-dire que si $g=h\circ\varphi$ comme ci-dessus, alors on a bien
$\int_{[g]}\alpha=\int_{[h]}\alpha$ comme la notation le laisse supposer
(autrement dit l'intégrale ne dépend que de la classe 
d'équivalence $[g]$ de $g$). Pour le voir, on écrit
$h^*\alpha(\tau)=F(\tau)\,|d\tau_1\wedge\ldots\wedge d\tau_p|$ et on
applique le changement de variable  $\tau=\varphi(t)$ pour obtenir
$$
\eqalign{
g^*\alpha&=(h\circ\varphi)^*\alpha=\varphi^*(h^*\alpha)=
\varphi^*\big(F(\tau)\,|d\tau_1\wedge\ldots\wedge d\tau_p|\big)\cr
&=F\circ\varphi(t)\,|\Jac\varphi(t)|\,|dt_1\wedge\ldots\wedge dt_p|.\cr}
$$
Or la formule (2.6) implique
$$
\int_U F\circ\varphi(t)\,|\Jac\varphi(t)|\,|dt_1\wedge\ldots\wedge dt_p|=
\int_V F(\tau)\,|d\tau_1\wedge\ldots\wedge d\tau_p|,
$$
d'où l'égalité souhaitée $\int_U g^*\alpha=\int_Vh^*\alpha$. Dans 
le cas de la $p$-densité d'aire euclidienne $dS=\sqrt{\sum dx_I^2}$, 
on obtient la formule
$$
\boxed{16}{
\aire([g])=\int_{[g]}dS=
\int_{U}g^*dS=\int_U\sqrt{\sum_{I\in\cC_p(n)}(\Jac g_I(t))^2}\,
dt_1\ldots dt_p}\leqno(3.20\,{\rm c})
$$
où
$$
\boxed{16}{
\Jac g_I(t)=\det\Big({\partial g_{i_k}\over \partial t_\ell}
\Big)_{1\le k,\ell\le p}.}
$$
Les considérations qui précèdent montrent que l'aire d'une nappe
paramétrée $g$ ne dépend bien que de la classe d'équivalence $[g]$. 
Dans  le cas d'une courbe $g:U\to\Omega$ (avec $p=1$, $U\subset\bR$), on
retrouve l'expression de la longueur déjà donnée par (3.3$\,$b)
$$
\longueur([g])=\int_U\sqrt{\sum_{1\le i\le n} g'_i(t)^2}\,dt.
\leqno(3.20\,{\rm d})
$$

{\bf (3.21) Intégration des formes différentielles.} Pour toute nappe
paramétrée $g:\ovl U\to\Omega$ de dimension $p$ et de classe $C^1$, et 
toute $p$-forme différentielle $\alpha$ continue sur~$\Omega$, on peut 
utiliser essentiellement la même approche et poser
$$
\int_U g^*\alpha=\int_U
f(t_1,\ldots,t_p)\,dt_1\wedge\ldots\wedge dt_p
=\int_U f(t_1,\ldots,t_p)\,dt_1\ldots dt_p
$$
après évaluation de la $p$-forme 
$g^*\alpha=f(t_1,\ldots,t_p)\,dt_1\wedge\ldots\wedge dt_p$ en fonction des
paramètres~$t_j$. Cependant, l'effet d'un changement de variable 
$t=\varphi(\tau)$ fera
intervenir $\Jac\varphi$ (et non pas $|\Jac\varphi|$) dans l'expression
de $\varphi^*(g^*\alpha)$, de sorte que l'intégrale va changer de signe
si $\Jac\varphi<0$. L'intégrale n'est donc la même que pour les
classes d'équivalence $[g]^+$ de nappes paramétrées {\it orientées}, 
avec par définition $g\sim^+ h$ si $g=h\circ\varphi$ pour un certain
difféo\-mor\-phisme $\varphi:\ovl U\to\ovl V$ tel que $\Jac\varphi>0$
(on définit de même la classe d'orientation opposée $[g]^-$ comme la 
classe d'équivalence des $h=g\circ\psi$
avec $\Jac\psi<0$, classe qui bien sûr ne contient pas $g$ elle-même). 
Il est licite de poser par définition
$$
\boxed{16}{
\int_{[g]^+}\alpha=\int_U g^*\alpha,}\leqno(3.21\,{\rm a})
$$
et avec les notations précédentes on a
$$
\boxed{16}{
\int_{[g]^-}\alpha=-\int_{[g]^+}\alpha.}\leqno(3.21\,{\rm b})
$$
Dans le cas des courbes (dimension $p=1$), considérer une classe 
d'orientation\break donnée $[g]^+$ correspond à n'autoriser que 
les changements
de variables strictement croissants. Si $g:\ovl U\to\Omega$ est une 
courbe, $[g]^+$ sa classe d'équivalence orientée
et
$\alpha=\sum_{1\le j\le n}\alpha_j(x)\,dx_j$ une $1$-forme
différentielle sur $\Omega$, on retrouve
l'{\it intégrale curviligne}
$$
\int_{[g]^+}\sum_{1\le j\le n}\alpha_j(x)\,dx_j=\int_U g^*\alpha=\int_U
\sum_{1\le j\le n}\alpha_j(g(t))\,g'_j(t)\,dt\leqno(3.21\,{\rm c})
$$
(où le choix de l'orientation $[g]^+$ implique que l'on range les bornes de 
l'intervalle $U$ dans l'ordre croissant).
\medskip

Nous en arrivons maintenant au point culminant de ce paragraphe, à
savoir la formule de Stokes pour des sous-variétés à bord orientées
de dimension quelconque dans $\bR^n$.
\medskip

{\bf (3.22) Notions de sous-variété et de sous-variété à bord.} 
Une partie $M$ de $\bR^n$ est appelée sous-variété (sans 
singularités et sans bord) de dimension $p$ et de classe $C^k$ si tout 
point $x_0\in M$ possède,
après permutation éventuelle des coordonnées (laquelle permutation
dépend a priori du point $x_0$), un voisinage parallélépipédique 
$P_{x_0}=\prod{}]a_j,b_j[$ tel que $M\cap P_{x_0}$ soit un graphe
d'équation
$$
x_i=w_i(x_1,\ldots x_p),\qquad p+1\le i\le n,\leqno(3.22\,{\rm a})
$$
pour des fonctions $w_i:P'_{x_0}=\prod_{j\le p}{}]a_j,b_j[{}\to{}]a_i,b_i[$
de classe $C^k$, \hbox{$p+1\le i\le n$}. [D'après le théorème des
fonctions implicites, il est équivalent de supposer que 
\hbox{$M\cap P_{x_0}$}
peut être défini par $n-p$ équations $f_j(x)=0$, $1\le j\le
n-p$, ayant des différentielles $df_j$ linéairement indépendantes sur
$V$.] On utilise le terme de «\?courbe\?» lorsque~\hbox{$p=1$},
«\?surface\?» lorsque $p=2$ et «\?hypersurface\?»\
lorsque $p=n-1$. Pour obtenir une paramétrisation $g:U\to M\cap P_{x_0}$
de $M\cap P_{x_0}$ sur un ouvert $U\subset\bR^p$, il suffit
de choisir un $C^k$ difféomorphisme arbitraire 
$$
\varphi=(\varphi_1,\ldots,\varphi_p):U\to P'_{x_0},\qquad 
t\mapsto (x_1,\ldots,x_p)=\varphi(t)
$$
et de définir $g:U\to P$ par 
$$
g(t)=\big(\varphi_1(t),\ldots,\varphi_p(t),w_{p+1}(\varphi(t)),\ldots,
w_n(\varphi(t))\big).\leqno(3.22\,{\rm b})
$$
Le choix $\varphi=\Id_{P'_{x_0}}$ sur $U=P'_{x_0}$, c'est-à-dire 
$x_i=\varphi_i(t_1,\ldots,t_p)=t_i$, $1\le i\le p$, est naturellement 
permis. On voit
ainsi que toute sous-variété de dimension $p$ peut se définir
localement comme une nappe paramétrée $g$ de dimension 
$p$ telle que l'une des projections $p$-dimensionnelle 
$\varphi=(g_{i_1},\ldots,g_{i_p})$ soit un
difféomorphisme local sur un ouvert $U$ de $\bR^p$. {\it Orienter la 
sous-variété} $M$ consiste à choisir une famille de paramétrisations
locales recouvrant la totalité de $M$ et ayant tous «\?la même 
orientation\?», 
c'est-à-dire tels que les changements de paramétrisation soient tous à
jacobien${}>0$ (ceci peut se faire par exemple en considérant des 
projections $x\mapsto(x_{i_1},\ldots,x_{i_p})$ et en permutant
les coordonnées si nécessaire).

%%\InsertPSFile  3 100 76 76 {dgplot2_src.ps}
\InsertImage 3 100 0 95 1.0 0 {dgplot2.png}
\LabelTeX 10 90 $p=2$\ELTX
\LabelTeX 10 85 $n=3$\ELTX
\LabelTeX 17 35 $x_1<w_1(x_2)$\ELTX
\LabelTeX 84 50 $M$\ELTX
\LabelTeX 25 48 $x_0\in\partial M$\ELTX
\LabelTeX 80 90 $x_3=w_3(x_1,x_2)$\ELTX
\EndFig
\medskip
\centerline{{\bf Fig.~20.} Un exemple de sous-variété à bord
$(M,\partial M)$.}
\medskip

Plus généralement (cf.\ Fig.~20), on appelle sous-variété à 
bord de dimension $p$ 
et de classe $C^k$ une paire de sous-variétés $(M,\partial M)$ de 
dimensions respectives $p$ et $p-1$ et de classe $C^k$, disjointes,
avec $\partial M\subset \ovl M$, de sorte que pour tout
point $x_0\in \partial M$, il existe, après permutations éventuelle des
coordonnées, un voisinage parallélépipédique 
\hbox{$P_{x_0}=\prod{}]a_j,b_j[$} tel que $M\cap P_{x_0}$ soit un graphe
d'équation
$$
\cases{x_1<w_1(x_2,\ldots x_p),\qquad\hbox{resp.}\quad 
x_1>w_1(x_2,\ldots x_p),\cr
\noalign{\vskip3pt}
x_i=w_i(x_1,\ldots x_p),\qquad p+1\le i\le n,\cr}\leqno(3.22\,{\rm c})
$$
et $\partial M\cap P_{x_0}$ le graphe
d'équations
$$
\cases{x_1=w_1(x_2,\ldots x_p),\cr
\noalign{\vskip3pt}
x_i=w_i(x_1,\ldots x_p),\qquad p+1\le i\le n,\cr}
\leqno(3.22\,{\rm d})
$$
pour des fonctions de classe $C^k$
$$
\eqalign{
w_1&:\prod_{2\le j\le p}{}]a_j,b_j[{}\to{}]a_1,b_1[{},\cr
w_i&:\prod_{1\le j\le p}{}]a_j,b_j[{}
\cap\big\{\pm(x_1-w_2(x_2,\ldots,x_p))\ge 0\big\}\to{}]a_i,b_i[{},
\quad p+1\le i\le n.\cr}
$$
[On~prendra garde au fait que dans cette
notation, en général, $\partial M$ {\it n'est pas} la frontière de $M$
au sens topologique, puisque $M$ est d'intérieur vide si $p<n$.]

Dans cette situation, une paramétrisation très commode de $M$ consiste à
utiliser les variables $t=(t_1,\ldots,t_p)$ telles que
$$
\cases{
t_1=\varepsilon(x_1-w_1(x_2,\ldots,x_p))\cr 
t_2=x_2\cr
\kern15pt\vdots\cr
t_p=x_p\cr}
\Leftrightarrow
\varphi(t)=
\cases{
x_1=\varepsilon t_1+w_1(t_2,\ldots,t_p)\cr 
x_2=t_2\cr
\kern15pt\vdots\cr
x_p=t_p\cr}
\leqno(3.22\,{\rm e})
$$
où $\varepsilon=\pm 1$ est choisi de manière que l'orientation
attribuée à $M$ soit fournie par la paramétrisation $\varphi$ 
[$\,\varphi$ est bien un difféomorphisme de $\bR\times\prod_{2\le j\le p}{}
]a_j,b_j[\subset\bR^p$ sur lui-même, de jacobien constant~$\varepsilon$], 
avec de plus
$$
x_j=w_j(x_1,\ldots,x_p)=w_j(\varphi(t)),\qquad p+1\le j\le n.
\leqno(3.22\,{\rm f})
$$
Si (quitte à prendre $\eta$ assez petit et à 
restreindre les intervalles $]a_j,b_j[$, \hbox{$2\le j\le p$}) on pose 
$U'=\{0\}\times\prod_{2\le j\le p}{}]a_j,b_j[$ et
$$
U={}]0,\eta[{}\times\prod_{2\le j\le p}{}]a_j,b_j[,\quad\hbox{resp.}\quad
U={}]-\eta,0[{}\times\prod_{2\le j\le p}{}]a_j,b_j[{},
$$
ceci conduit à une paramétrisation de classe $C^k$
$$
\leqalignno{
\qquad g:\bR^p\supset U\cup U'&{}
\to (M\cup\partial M)\cap P_{x_0},&(3.22\,{\rm g})\cr 
t\quad&{}\mapsto{}\quad
g(t)=\big(\varphi(t),w_{p+1}(\varphi(t)),\ldots,w_n(\varphi(t))\big)\cr}
$$
telle que
$$
\leqalignno{
&U\subset{}]-\infty,0[{}\times\bR^{p-1}\quad\hbox{ou}\quad
U\subset{}]0,+\infty[{}\times\bR^{p-1},&(3.22\,{\rm h})\cr
&U'\subset \ovl U\cap\{0\}\times\bR^{p-1},\quad
g(U)=M\cap P_{x_0},\quad g(U')=\partial M\cap P_{x_0}.\cr}
$$
En effet, par construction, la partie $M\cap P_{x_0}$ va être
définie par la condition $t_1>0$ ou $t_1<0$, et sa frontière
$\partial M\cap P_{x_0}$ sera donnée par la condition $t_1=0$.
\medskip

{\bf (3.23) Convention d'orientation du bord.} Soit $(M,\partial M)$
une sous-variété à bord de dimension $p$ dans $\bR^n$, munie d'une
orientation. Au voisinage d'un point $x_0$ de~$\partial M$, 
on peut paramétriser $M$ à l'aide d'une nappe $g:U\cup U'\to
M\cup\partial M$ satisfaisant (3.22$\,$g,h), et telle que $M$ soit 
positivement orientée par 
$(t_1,\ldots,t_p)$ (on remplace au besoin $t_1$ par $-t_1$).
Alors on convient d'orienter 
$\partial M$ comme suit~: si $M$ est donnée par $\{t_1<0\}$, on
oriente $\partial M$ à l'aide des paramètres $(t_2,\ldots,t_p)$,
tandis que si $M$ est donnée par $\{t_1>0\}$ on choisit l'orientation 
inverse de $(t_2,\ldots,t_p)$ [si $p\ge 2$, on peut ainsi choisir par exemple 
$(-t_2,t_3,\ldots,t_p)\,$; si $p=1$, le bord $\partial M$ consiste en 
des points isolés, orienter ces points consiste juste à leur affecter 
le coefficient $+1$ ou $-1$ suivant que $M$ est donnée par $t_1<0$ 
ou $t_1>0$, respectivement.] 

\InsertFig 10.000 65.000 {
1 mm unit
  0.226 setlinewidth
 30.000  50.000 moveto
[  30.000  50.000   29.000  50.000   28.000  50.000   15.000  35.000
   17.000  30.000   10.000  25.000   28.000  10.000   29.000  10.000
   30.000  10.000
] curve gsave closepath 0.9 setgray fill grestore stroke 
 80.000  50.000 moveto
[  80.000  50.000   81.000  50.000   82.000  50.000   95.000  35.000
   93.000  30.000  100.000  25.000   82.000  10.000   81.000  10.000
   80.000  10.000
] curve gsave closepath 0.9 setgray fill grestore stroke 
  0.113 setlinewidth
  5.000  30.000 moveto 
 45.000   0.000 2.4 vector 
 30.000   5.000 moveto 
 55.000  90.000 2.4 vector
 65.000  30.000 moveto 
 45.000   0.000 2.4 vector 
 80.000   5.000 moveto 
 55.000  90.000 2.4 vector
  0.226 setlinewidth
newpath  23.000 38.000 2 2 -150 150 0 ellipsearc stroke
 21.000 39.000 moveto 0 215 1.2 vector
newpath  87.000 38.000 2 2 -150 150 0 ellipsearc stroke
 85.000 39.000 moveto 0 215 1.2 vector
  1.000  0.000  0.000 setrgbcolor
 30.000  10.5000 moveto  30.000  50.000 lineto stroke
 30.000  39.000 moveto  0 90 2.4 vector
 80.000  10.5000 moveto  80.000  50.000 lineto stroke
 80.000  37.000 moveto  0 270 2.4 vector
}
\LabelTeX   14.200  58.000 $t_2,\ldots,t_p$\ELTX
\LabelTeX   47.900  25.500 $t_1$\ELTX
\LabelTeX   64.200  58.000 $t_2,\ldots,t_p$\ELTX
\LabelTeX  107.900  25.500 $t_1$\ELTX
\LabelTeX   32.000  37.000 $\RGBColor{1 0 0}{U'}$\ELTX
\LabelTeX   74.000  37.000 $\RGBColor{1 0 0}{U'}$\ELTX
\LabelTeX   12.000  40.000 $U$\ELTX
\LabelTeX   95.500  40.000 $U$\ELTX
\EndFig
\vskip-10pt
\centerline{{\bf Fig.~21.} Convention d'orientation du bord.}
\medskip

Il est facile de voir que l'orientation ainsi
obtenue sur $\partial M$ ne dépend que de celle de $M$ et pas
de la paramétrisation $g$ choisie, sous réserve bien sûr que 
$g$ satisfasse les hypothèses précédentes.
\medskip

{\bf (3.24) Intégration sur les sous-variétés orientées.} Soit
$\Omega$ un ouvert de $\bR^n$, $\alpha$~une $p$-forme différentielle
sur $\Omega$ à coefficients continus, et $(M,\partial M)$ une 
sous-variété à bord orientée de dimension $p$ et de classe $C^k$, 
$k\ge 1$, contenue dans~$\Omega$. On suppose
que l'intersection $K=(M\cup\partial M)\cap\Supp\alpha$ du support de 
$\alpha$ avec $M\cup\partial M$ est compact. Alors $K$ peut être 
recouvert par un nombre fini de
pavés $P_j\subset\Omega$, $1\le j\le N$, dans lesquels on a des
paramétrisations orientées $g_j:U_j\cup U'_j\to 
(M\cup\partial M)\cap P_j$ comme ci-dessus. Soit $(\theta_j)$ une
partition de l'unité sur $K$ suppordonnée aux pavés $P_j$,
c'est-à-dire une collection de fonctions $\theta_j$ continues
à support compact dans $P_j$ telles que $0\le\theta_j\le
1$ et $\sum\theta_j=1$ sur $K$ (il suffit d'utiliser un
quadrillage assez fin, et de considérer les fonctions $\theta_{j,p}$
définies par (2.4), qui sont en fait de classe $C^1$).
Dans ces conditions on peut écrire 
$\alpha=\sum\alpha_j$ avec $\alpha_j=\theta_j\alpha$ à support 
dans~$P_j$, et on pose
$$
\boxed{16}{
\int_M\alpha=\sum_j\int_{M\cap P_j}\alpha_j=\int_{U_j}g_j^*\alpha_j}
$$
conformément à la définition (3.21$\,$a). L'invariance des intégrales 
par changement  de variable orienté montre aisément que le résultat
est en réalité indépendant du découpage et des paramétrisations
orientées choisies (si on a une autre
partition de l'unité $\theta'_k$ à support dans~$P'_k$, on redécoupe 
suivant $\alpha_{jk}=\theta_j\theta'_k\alpha$ qui est à support dans 
$P_j\cap P'_k$ et on utilise la linéarité de l'intégrale$\,\ldots$). 
Nous pouvons maintenant énoncer la
\medskip

{\bf (3.25) Formule de Stokes.} {\it Soit $\Omega$ un ouvert de
$\bR^n$, $\alpha$~une $(p-1)$-forme différentielle sur $\Omega$ de
classe $C^1$, et $(M,\partial M)$ une sous-variété à bord
orientée de dimension $p$ et de classe $C^k$, $k\ge 1$, contenue
dans~$\Omega$, telle que $(M\cup\partial M)\cap \Supp\alpha$ soit
compact $[$le cas usuel est celui où la variété à bord
$M\cup\partial M$ est elle-même compacte$]$. Alors
$$
\boxed{16}{
\int_M d\alpha = \int_{\partial M}\alpha,}
$$
à condition que les orientations de $M$ et $\partial M$ soient choisies
l'une en fonction de l'autre comme il a été spécifié au paragraphe 
$(3.23)$.}

{\it Démonstration.} D'après la définition (3.24), il suffit de montrer
que l'on a
$$
\int_{M\cap P_j}d\alpha_j=\int_{\partial M\cap P_j}\alpha_j
$$
pour tout $j$ et de faire la somme (si les $\theta_j$ sont choisies de classe 
$C^1$, ce qui est possible, alors $\alpha_j=\theta_j\alpha$ est aussi
de classe $C^1$). Maintenant, on écrit que
par définition
$$
\int_{M\cap P_j}d\alpha_j=\int_{U_j}g_j^*(d\alpha_j)=
\int_{U_j}d(g_j^*\alpha_j),\qquad
\int_{\partial M\cap P_j}\alpha_j=\int_{U'_j}g_j^*\alpha_j
$$
où 
$$
g_j:U_j\cup U'_j\to (M\cup \partial M)\cap P_j,\qquad 
t=(t_1,\ldots,t_p)\mapsto g(t)
$$
est une paramétrisation choisie comme dans 3.22$\,$(e,f,g,h).
En faisant les calculs des images inverses $\beta=g_j^*\alpha_j$
mises en jeu dans les coordonnées $(t_1,\ldots,t_p)$,
on est ramené à traiter le cas d'une forme $\beta$ de degré $(p-1)$
en $(t_1,\ldots,t_p)$, qui s'écrira donc
$$
\beta(t)=\sum_{i=1}^p f_i(t)\,dt_1\wedge\ldots\wedge dt_{i-1}
\wedge dt_{i+1}\wedge\ldots\wedge dt_p.
$$
En outre, quitte à translater l'origine, on peut supposer que $\beta$ 
est à support compact dans un pavé
\hbox{$P=\prod_{1\le i\le p}{}]-c_i,c_i[{}\subset\bR^p$},
et qu'on est dans l'un ou l'autre des deux cas suivants~:
$$
\leqalignno{
\kern 30pt M&=P,\qquad
\partial M=\emptyset,&(3.25\,{\rm a})\cr
\noalign{\vskip5pt}
\kern 30pt 
M&=P_-={}]-c_1,0[{}\times\prod_{2\le i\le p}{}]-c_i,c_i[{},\qquad
\partial M =\{0\}\times\prod_{2\le i\le p}{}]-c_i,c_i[.
&(3.25\,{\rm b})\cr}
$$
[Si $M=P_+={}]0,c_1[{}\times\prod_{2\le i\le p}{}]-c_i,c_i[$,
on se ramène aisément au cas 
$M=P_-$ en changeant $t_1$ en $t'_1=-t_1$, ce qui a juste pour effet de 
changer simultanément l'orientation de $M$ et de~$\partial M$.]

Or on a 
$$
d\beta=\sum_{1\le i\le p}(-1)^{i-1}
{\partial f_i\over\partial t_i}\,dt_1\wedge\ldots\wedge dt_p,
$$
donc
$$
\int_M d\beta=\int_M \sum_{1\le i\le p}(-1)^{i-1}
{\partial f_i\over\partial t_i}\,dt_1\ldots dt_p.
$$
Dans le cas (3.25$\,$a), une intégration à une variable fournit 
pour tout $i=1,\ldots,p$ l'égalité
$$
\eqalign{
\int_{-c_i}^{c_i}
&{\partial f_i\over\partial t_i}(t_1,\ldots,t_p)\,dt_i\cr
&=f_i(t_1,\ldots,t_{p-1},c_i,t_{p+1},\ldots,t_p)-
f_i(t_1,\ldots,t_{p-1},-c_i,t_{p+1},\ldots,t_p)=0\cr}
$$
du fait que $f_i$ est à support compact dans $P$ et donc nulle sur
$\partial P$. Il vient par conséquent
$\int_M\partial f_i/\partial t_i\,dt_1\ldots dt_p=0$ grâce au théorème
de Fubini, et comme $\partial M=\emptyset$ on a bien
$$
\int_M d\beta=0=\int_{\partial M}\beta.
$$
Dans le cas (3.25$\,$b) 
on voit qu'on a encore $\int_M\partial f_i/\partial t_i\,dt_1\ldots dt_p=0$
pour $i\ge 2$ par le même raisonnement que ci-dessus, tandis que
$$
\int_{-c_1}^{0}{\partial f_1\over\partial t_1}(t_1,\ldots,t_p)\,dt_1
=f_1(0,t_2,\ldots,t_p),
$$
puisque la valeur de $f_1(t_1,\ldots,t_p)$ en $t_1=-c_1$ est nulle
[cette valeur n'est bien sûr pas nécessairement nulle dans le cas $t_1=0$, 
qui correspond à un point $t\in\partial M$].
D'après le théorème de Fubini, on obtient
$$
\int_M d\beta=\int_{P_-}{\partial f_1\over\partial t_1}dt_1\ldots dt_p=
\int_{\Pi_{2\le i\le p}]-c_i,c_i[}f_1(0,t_2,\ldots,t_p)\,dt_2\ldots dt_p.
$$
Or, le résultat de la substitution $t_1=0$ dans $\beta$ donne la
$(p-1)$-forme
$$
\beta_{|\{t_1=0\}}=f_1(0,t_2,\ldots,t_p)\,dt_2\wedge \ldots\wedge dt_p,
$$
et on a donc aussi
$$
\int_{\partial M}\beta=
\int_{\Pi_{2\le i\le p}]-c_i,c_i[}f_1(0,t_2,\ldots,t_p)\,dt_2\ldots dt_p.
$$
Ceci conclut la démonstration.\qed
\medskip

{\bf (3.26) Remarque.} La formule de Stokes est encore vraie si
$\partial M$ est de classe $C^1$ par morceaux, c'est-à-dire si
$\partial M$ est localement $C^1$-difféomorphe à un domaine
polyédral. Pour cela, il suffit d'observer que si $S$ est l'ensemble des
arêtes $(p-2)$-dimensionnelles et $S_\varepsilon$ l'ensemble des
points situés à distance inférieure ou égale à $\varepsilon$
de~$S$, alors\break \hbox{$\aire_{p-1}(\partial M\cap S_\varepsilon)\le
C\varepsilon$} et $\aire_p(M\cap S_\varepsilon)\le C'\varepsilon^2$. On
peut par conséquent se ramener au cas d'une forme $\alpha$ nulle au
voisinage de $S$ en considérant
$\alpha_\varepsilon=(1-\theta_\varepsilon)\alpha$ où
$\theta_\varepsilon$ est égale à $1$ au voisinage de $S$, à
support dans $S_\varepsilon$ et telle que $|d\theta_\varepsilon|\le
C''{1\over\varepsilon}$. On voit alors aisément que
$\int_{\partial M}\alpha_\varepsilon$ et $\int_Md\alpha_\varepsilon$
convergent vers les limites attendues quand $\varepsilon$ tend vers~$0$.
\medskip

{\bf (3.27) Cas particuliers de la formule de Stokes.} Observons
tout d'abord que dans le cas d'une courbe orientée $(\dim M=p=1$), la formule
de Stokes se réduit à une formule équivalente à (3.3$\,$c), à savoir
$$
\int_{\partial M}df=\sum_{x\in\partial M} \varepsilon_x f(x),
\leqno(3.27\,{\rm a})
$$
avec $\varepsilon_x=+1$ si $x\in\partial M$ est une extrêmité d'arc
orienté et $\varepsilon_x=-1$ si $x\in\partial M$ est une origine d'arc 
orienté ($M$ pouvant comprendre a priori plusieurs arcs orientés). Nous
examinons maintenant le cas où $p\ge 2$, lorsque la dimension ambiante
est petite.

Lorsque $p=n=2$, le cas typique est celui d'un domaine borné
$M\subset\bR^2$ à bord de classe $C^1$. Avec l'orientation canonique
de $\bR^2$ et l'orientation induite sur $\partial M$, on obtient la
formule dite de {\it Green-Riemann}
$$
\int_{\partial M}P(x,y)\,dx+Q(x,y)\,dy=
\int\!\!\!\int_M\Big({\partial Q\over\partial y}-
{\partial P\over\partial x}\Big)\,dx\,dy,
\leqno(3.27\,{\rm b})
$$
valable pour toute forme $\alpha=P(x,y)\,dx+Q(x,y)\,dy$ de classe $C^1$
sur $\ovl M$ $\big($on a bien $d\alpha=\big({\partial Q\over\partial y}-
{\partial P\over\partial x}\big)\,dx\wedge dy\big)$.

Le cas suivant est $p=2$, $n=3$. On se donne une $1$-forme $\alpha=
\ovr{V(x)}\cdot\ovr{dx}$ de classe $C^1$ sur un ouvert $\Omega$ contenant 
une surface compacte orientée à bord 
$M\cup\partial M\subset\bR^3$. Comme $d\alpha=\ovr{\rot}\ovr{V}\cdot\ovr{dS}$,
on obtient la formule attribuée originellement à {\it Stokes}
$$
\int_{\partial M}\ovr{V(x)}\cdot\ovr{dx} = \int\!\!\!\int_M
\ovr{\rot}\ovr{V}\cdot\ovr{dS}.
\leqno(3.27\,{\rm c})
$$
Enfin, pour $p=n=3$, il s'agit du cas d'un domaine à bord compact
$M\cup\partial M\subset\bR^3$. On considère dans ce cas une $2$-forme
$\alpha=\ovr{V}\cdot\ovr{dS}$ de classe $C^1$ sur $\ovl M$ et sa 
différentielle extérieure
$d\alpha=\div\ovr{V}\,dx_1dx_2dx_3$. Ceci donne la formule dite
de {\it Green-Ostrogradski}
$$
\int\!\!\!\int_{\partial M}\ovr{V(x)}\cdot\ovr{dS} = 
\int\!\!\!\int\!\!\!\int_M \div\ovr{V}\,dx_1dx_2dx_3.
\leqno(3.27\,{\rm d})
$$
\chapterjump

\chapterrunning{III.}
\phantom{$\ $}
\medskip
\centerline{\fourteenbf Chapitre III}
\bigskip
\centerline{\fourteenbf Théorèmes généraux de convergence}
\medskip
\centerline{\fourteenbf Espaces 
$\hbox{\fourteenbfit L}^{\hbox{\twelvebfit p}}$ et
fonctions mesurables}
\vskip3cm

Nous établissons ici un pont direct entre la théorie de Henstock-Kurzweil
et la théorie de la mesure. Ceci se fait en observant que
l'intégrale de jauge satisfait les théorèmes de convergence
fondamentaux que sont le théorème de convergence monotone et le
théorème de convergence dominée. Ceci permet d'établir de
manière naturelle l'exis\-tence de la mesure de Lebesgue dans $\bR^n$.
La substance de ce chapitre correspond à un (solide) niveau de L3,
mais peut aussi se traiter en Master~1, par exemple comme introduction à la 
théorie générale de la mesure.
\bigskip

\section{1. Lemme de Henstock et théorème de Hake}

Le but du lemme de Henstock est d'obtenir des estimations fines
pour les sommes de Riemann calculées sur des familles de sous-pavés
d'un pavé $P$ qui ne constituent pas nécessairement un
découpage complet de $P$. Ces estimations ont elles-mêmes de nombreuses
conséquences importantes.
\medskip

{\bf (1.1) Lemme de Henstock.} {\it Soit $P$ un pavé fermé borné 
de $\bR^n$ et 
$f:P\to\bR$ une fonction HK-intégrable sur $P$. Soient $\varepsilon>0$ et
$\delta$ une jauge $\varepsilon$-adaptée à $f$ sur $P$. Soient enfin
$(Q_i)_{1\le i\le N}$ des sous-pavés de $P$ d'intérieurs deux à deux 
disjoints, et $x_i\in Q_i$, 
\hbox{$1\le i\le N$}, des points choisis dans ces pavés.  Si 
ceux-ci sont $\delta$-fins, c'est-à-dire si 
\hbox{$\diam(Q_i)\le\delta(x_i)$},
alors
$$\leqalignno{
&\Big|\sum_{i=1}^N f(x_i)\vol(Q_i)-
\sum_{i=1}^N \int_{Q_i}f(x)\,dx\Big|\le \varepsilon\;;&\hbox{\rm(a)}\cr
&\sum_{i=1}^N\Big| f(x_i)\vol(Q_i)-
\int_{Q_i}f(x)\,dx\Big|\le 2\varepsilon.&\hbox{\rm(b)}\cr
}
$$}

{\it Démonstration.} Soit $\eta>0$ arbitrairement petit. Le
complémentaire $P\ssm\bigcup Q_i^\circ$ peut se décomposer en la
réunion d'un nombre fini de pavés fermés $R_j$ d'intérieurs
disjoints (ayant pour sommets des points de $\bR^n$ dont les
coordonnées sont des projections de sommets de $P$ ou des
$Q_i$). Sur chaque $R_j$ on peut trouver une jauge
$\delta_j\le\delta_{|R_j}$ telle que
$$
\Big|S_{D_j}(f)-\int_{R_j}f(x)\,dx\Big|\le\eta
$$
pour toute subdivision pointée $\delta_j$-fine $D_j$ de $R_j$. En prenant la
réunion des pavés pointés $(Q_i,x_i)$ et des subdivisions $D_j$ des
pavés $R_j$, on obtient une subdivision pointée
$\delta$-fine de $[a,b]$, par conséquent
$$\Big|\sum_if(x_i)\vol(Q_i)+
\sum_jS_{D_j}(f)-\int_Pf(x)\,dx\Big|\le\varepsilon.$$
En soustrayant toutes les inégalités précédentes et en tenant 
compte du fait
que $\int_Pf(x)\,dx=\sum_i\int_{Q_i}f(x)\,dx+\sum_j\int_{R_j}f(x)\,dx$, 
il vient
$$\Big|\sum_if(x_i)\vol(Q_i)-\sum_i\int_{Q_i}f(x)\,dx
\Big|\le\varepsilon+r\eta$$
où $r$ est le nombre de pavés $R_j$ mis en jeu. Comme $\eta>0$
est arbitraire, l'inégalité (a) s'ensuit.

Pour obtenir (b), on applique séparément l'inégalité (a) aux
pavés $Q_i$ pour lesquels $f(x_i)\vol(Q_i)-\int_{Q_i}f(x)\,dx\ge 0$ 
(resp.${}\le 0$), et on fait la somme.\qed
\medskip

Nous commencerons par un corollaire élémentaire en dimension $1$, puis
nous démontre\-rons son analogue, sensiblement plus subtil, en dimension 
supérieure.
\medskip

{\bf (1.2) Théorème.} {\it Pour toute fonction $f$ HK-intégrable sur
un intervalle $[a,b]$, l'inté\-grale indéfinie $x\mapsto\int_a^xf(t)\,dt$
est continue sur $[a,b]$.}

{\it Démonstration.} Il s'agit de prouver que $\forall x\in[a,b]$,
$\int_x^{x+h}f(t)\,dt$ tend vers $0$ avec $h$. Soit $\varepsilon>0$ et
$\delta$ une jauge $\varepsilon$-adaptée à $f$ sur $[a,b]$. Prenons 
$h$ tel que $|h|\le\delta(x)$. En appliquant le lemme de Henstock 4.1~(a)
à l'unique intervalle $[a_1,b_1]=[x,x+h]$ avec $x_1=x\in[a_1,b_1]$, il vient
$$\Big| f(x)h-\int_x^{x+h}f(t)\,dt\Big|\le\varepsilon,$$
donc
$$\Big|\int_x^{x+h}f(t)\,dt\Big|\le\varepsilon+|f(x)h|\le 2\varepsilon$$
pour $|h|\le\min(\delta(x),\varepsilon/|f(x)|)$. Le corollaire est 
démontré.\qed
\medskip

{\bf (1.3) Théorème.} {\it Soit $P'=\prod[a'_k,b'_k]$ est un pavé 
fermé  contenu dans $P=\prod[a_k,b_k]$. Nous écrivons que $P'$ tend vers 
$\tilde P=\prod[\tilde a_k,\tilde b_k]\subset P$ si chaque borne 
$a'_k$, $b'_k$ de $P'$ tend vers la borne correspondante 
$\tilde a_k$, $\tilde b_k$ de $\tilde P$. Alors pour toute
fonction $f$ HK-intégrable sur~$P$, on a 
{\parindent=6.5mm
\item{\rm (a)}
$\displaystyle
\lim_{\vol(P')\to 0}\int_{P'}f(x)\,dx=0$.
\item{\rm (b)}
$\displaystyle
\lim_{P'\subset P,\,P'\to \tilde P}\int_{P'}f(x)\,dx=\int_{\tilde P}f(x)\,dx$.
\medskip
}}

{\it Démonstration.} (a) Si (a) n'était pas vrai, on pourrait
trouver un suite de pavés $P_\nu$ tels que $\vol(P_\nu)$ tend vers $0$
et $\big|\int_{P_\nu}f(x)\,dx\big|\ge\varepsilon_0>0$. Quitte à extraire
une sous-suite convergente de chacune des suites constituant les
bornes de $P_\nu$, on peut supposer que $P_\nu\to\tilde P$ pour un
certain pavé $\tilde P$.  On obtiendra une contradiction en montrant
que $\smash{\int_{P_\nu}f(x)\,dx}$ tend vers~$0$.  Comme $\vol(\tilde P)=0$,
le pavé $\tilde P$ vérifie $\tilde a_{i_0}=\tilde b_{i_0}$ pour un certain
indice~$i_0$. Il n'est pas restrictif de supposer que
$P_\nu=\prod_i[a_{\nu,i},b_{\nu,i}]$ contient sa limite $\smash{\tilde P=
\prod_i[\tilde a_i,\tilde b_i]}$. En effet, on
a sinon $a_{\nu,i}>\tilde a_i$ ou $b_{\nu,i}<\tilde b_i$ pour un certain $i$.
Si par exemple $a_{\nu,i}>a_i$, on écrit que
$$
\int_{P_\nu}f(x)\,dx=\int_{P'_\nu} f(x)\,dx-\int_{P''_\nu} f(x)\,dx
$$ ou $P'_\nu$ (resp.\ $P''_\nu$) est la suite de pavés dont le
$i$-ième facteur est $[\tilde a_i,b_{\nu,i}]$ (resp.\ $[\tilde
a_i,a_{\nu,i}]$) qui convergent tous deux vers des pavés $\tilde
P'=\tilde P$ et $\tilde P''$ de volume nul, avec cette fois les bonnes
inégalités $a'_{\nu,i}\le \tilde a'_i=\tilde a_i$, 
$a''_{\nu,i}\le \tilde a''_i=\tilde a_i$ (qui sont en fait des
égalités). Même raisonnement si $b_{\nu,i}<b_i$. En répétant 
la procédure pour chacun des
axes de coordonnées et en utilisant la formule de Chasles, on se
ramène ainsi par différences successives au cas où chaque pavé
$P_\nu$ de la suite contient sa limite~$\tilde P$.

On choisit maintenant $\delta$ une jauge $\varepsilon$-adaptée à
$f$ vérifiant la condition supplémentaire
$\delta(x)\le\smash{1\over 2}d(x,\tilde P)$ si $x\notin\tilde P$ et
$\delta(x)\le\varepsilon\, e^{-2n(|x|+\varepsilon)}/(1+|f(x)|)$ 
si $x\in\tilde P$. Pour toute
subdivision pointée $\delta$-fine $D=\{(Q_j, x_j)\}_{0\le j<N}$ de
$P$, ceci force les pavés $Q_j$ pointés par un point
$x_j\notin\tilde P$ à être contenus dans le complémentaire de
$\tilde P$, par conséquent la réunion
$\smash{\bigcup_{x_j\in\tilde P}Q_j}$ constitue un voisinage de
$\tilde P$ dans $P$, et on a donc $\smash{P_\nu\subset
\bigcup_{x_j\in\tilde P}Q_j}$ pour~\hbox{$\nu\ge\nu_\varepsilon$} assez
grand. Il en résulte que la famille $\{(P_\nu\cap
Q_j,x_j)_{x_j\in\tilde P}\}$ est une subdivision pointée
$\delta$-fine de $P_\nu$ pour~\hbox{$\nu\ge \nu_\varepsilon$}. D'après le
lemme de Henstock, nous en déduisons
$$
\bigg|\sum_{x_j\in\tilde P}f(x_j)\vol(Q_j)-\int_{P_\nu}f(x)\,dx\bigg|
\le\varepsilon.
$$ 
Si $\tilde P$ est tel que $\tilde a_{i_0}=\tilde b_{i_0}$, alors il est
contenu dans l'hyperplan $\{x_{i_0} = \tilde a_{i_0}\}$ et le lemme~1.4
ci-dessous implique que 
$$
\sum_{x_j\in\tilde P}\big|f(x_j)\big|\vol(Q_j)\le 2\varepsilon.
$$
On a donc
$\big|\int_{P_\nu}f(x)\,dx\big|\le 3\varepsilon$
pour~\hbox{$\nu\ge \nu_\varepsilon$}. Comme $\varepsilon>0$ est arbitraire, 
nous avons obtenu la contradiction désirée et la propriété (a)
s'ensuit.

(b) se déduit immédiatement de (a) et de la formule de Chasles, puisque
si $P'\to\tilde P$, les différences $P'\ssm\tilde P$ et
$\tilde P\ssm P'$ s'expriment comme des réunions finies de pavés dont le
volume tend vers $0$.\qed
\medskip

{\bf (1.4) Lemme.} {\it Soit $f:P\to\bR$ une fonction définie sur
un pavé fermé borné $P$ de~$\bR^n$ et $E\subset P$ une partie
finie contenue dans un hyperplan de coordonnées
$H=\{x_{i_0}=c\}$. On suppose que $(Q_j,x_j)$ est une famille
$\delta$-fine de pavés pointés d'intérieurs disjoints, avec
$Q_j\subset P$, $x_j\in E$, et $\delta(x_j)\le\varepsilon\,
e^{-2n(|x_j|+\varepsilon)}/(1+|f(x_j)|)$. Alors
$$
\sum_{x_j\in E}\big|f(x_j)\big|\vol(Q_j)\le 2\varepsilon.
$$
}
\vskip-8pt

{\it Démonstration.} Supposons pour simplifier l'écriture que $i_0=n$.
On pose alors
$$
Q_j=Q'_j\times[\alpha_j,\beta_j]\subset\bR^{n-1}\times\bR,\qquad 
c\in[\alpha_j,\beta_j].
$$
Quitte à remplacer $[\alpha_j,\beta_j]$ par $[\alpha_j,c]$ (resp.\ 
$[c,\beta_j]$) et à regrouper les pavés ainsi obtenus, on peut supposer 
que les pavés $Q_j$ sont adjacents à l'hyperplan $\{x_n=c\}$
et situés dans le même demi-espace délimité par celui-ci (ceci
donne alors éventuellement deux sommes à considérer, ce qui multiplie 
la constante finale par $2$ au plus). Sous cette hypothèse, les
pavés $Q'_j\subset\bR^{n-1}$ sont eux-mêmes d'intérieurs disjoints. Comme 
$$
\beta_j-\alpha_j\le\diam(Q_j)\le\delta(x_j)\le
\varepsilon\,e^{-2n(|x_j|+\varepsilon)}/(1+|f(x_j)|),
$$ 
nous avons 
$$
\vol(Q_j)\le \vol(Q'_j)\,\varepsilon\, e^{-2n(|x_j|+\varepsilon)}/(1+|f(x_j)|)
$$ 
et par conséquent
$$
|f(x_j)|\vol(Q_j)\le\varepsilon\vol(Q'_j)\,e^{-2n(|x_j|+\varepsilon)}.
$$
Or $\vol(Q'_j) \,e^{-2n(|x_j|+\varepsilon)}\le\int_{Q'_j}e^{-2n|x'|}dx'$
du fait que $\dim(Q'_j)\le\diam(Q_j)\le\varepsilon$, et puisque
$n|x'|=n\max_{i\le n-1}|x_i|\ge\sum_{i\le n-1}|x_i|$ on voit que
pour $M>0$ assez grand
$$
\eqalign{
\sum_j\vol(Q'_j) \,e^{-2n(|x_j|+\varepsilon)}\le \int_{[-M,M]^{n-1}}
e^{-2n|x'|}dx'
&\le \int_{[-M,M]^{n-1}}e^{-2\sum|x_i|}dx'\cr
&\le \prod_{i\le n-1}\int_{-M}^M e^{-2|\xi|}d\xi \le 1\cr}
$$
par le théorème de Fubini. Ceci conclut la preuve.\qed
\medskip

{\bf (1.5) Remarque.} Le lemme 1.4 permet de voir également
que l'intégrale $\int_Pf(x)\,dx$ n'est pas modifiée si on change
les valeurs de $f$ sur une tranche hyperplane $P\cap\{x_{i_0}=c\}$ (ou une
réunion finie de telles tranches), en particulier que cette
intégrale ne dépend pas des valeurs prises par $f$ sur le bord
$\partial P$. Il suffit comme ci-dessus de prendre des jauges
$\delta$ telles que $\delta(x)\le{1\over 2}|x_{i_0}-c|$ si $x_{i_0}\ne c$
et \hbox{$\delta(x)\le\varepsilon\,e^{-2n(|x|+\varepsilon)}/(1+|f(x|)$} sur 
l'hyperplan  $\{x_{i_0}=c\}$.\qed
\medskip

On se propose maintenant de donner la définition de l'intégrale de
Henstock-Kurzweil sur un pavé quelconque $P$ de $\bR^n$ (${}={}$produit 
d'intervalles quelconques, non nécessai\-rement fermés ni bornés).  
Lorsque $P$ est non compact, le principe consiste à introduire son
compactifié, à savoir son adhérence $\ovl P$ dans le
«\?compactifié d'Alexandroff\?» 
\hbox{$\smash{\hat\bR}^n=\bR^n\cup\{\infty\}$}. Si $f:P\to\bR$
est une fonction arbitraire, on l'étend à $\ovl P$ en posant
$f(x)=0$ pour $x\in\ovl P\ssm P$ (donc en particulier $f(\infty)=0$,
si $P$ est non borné)$\,$; en fait, d'après le lemme 1.4 et la 
remarque 1.5, les valeurs prises par $f$ sur $\partial P$ ne joueront
aucun rôle.  Les fonctions jauge sont également supposées
définies sur $\ovl P$, valeur à l'infini $\delta(\infty)$ y
comprise (là, il est important que $\delta$ soit définie sur un
ensemble compact pour assurer l'existence de subdivisions pointées
$\delta$-fines).  \medskip

\InsertFig 10.000 65.000 {
1 mm unit
  5.000  10.000 moveto 
105.000   0.000 2.4 vector 
 10.000   5.000 moveto 
 55.000  90.000 2.4 vector
 31.000  27.000 moveto  0.700 disk
 43.000  24.000 moveto  0.700 disk
 55.000  23.000 moveto  0.700 disk
 75.000  24.000 moveto  0.700 disk
 22.000  39.000 moveto  0.700 disk
 27.000  47.000 moveto  0.700 disk
 35.000  42.000 moveto  0.700 disk
 44.000  49.000 moveto  0.700 disk
 49.000  44.000 moveto  0.700 disk
 36.000  38.000 moveto  0.700 disk
 41.000  32.000 moveto  0.700 disk
 46.000  36.000 moveto  0.700 disk
 54.000  34.000 moveto  0.700 disk
 53.000  45.000 moveto  0.700 disk
 59.000  38.000 moveto  0.700 disk
 63.000  46.000 moveto  0.700 disk
 68.000  29.000 moveto  0.700 disk
 77.000  37.000 moveto  0.700 disk
 76.000  44.000 moveto  0.700 disk
 75.000  29.000 moveto  0.700 disk
  0.339 setlinewidth
 99.000  37.500 moveto  0.700 circle
 80.000  21.000 moveto   90.000  21.000 lineto stroke
 18.000  49.000 moveto   90.000  49.000 lineto stroke
 18.000  21.000 moveto   39.000  34.000 rectangle stroke
 39.000  21.000 moveto   50.000  28.000 rectangle stroke
 50.000  21.000 moveto   64.000  30.000 rectangle stroke
 64.000  21.000 moveto   80.000  27.000 rectangle stroke
 18.000  34.000 moveto   31.000  43.000 rectangle stroke
 18.000  43.000 moveto   37.000  49.000 rectangle stroke
 37.000  41.000 moveto   48.000  49.000 rectangle stroke
 31.000  34.000 moveto   44.000  41.000 rectangle stroke
 44.000  28.000 moveto   50.000  41.000 rectangle stroke
 50.000  38.000 moveto   56.000  49.000 rectangle stroke
 56.000  30.000 moveto   72.000  43.000 rectangle stroke
 72.000  40.000 moveto   80.000  49.000 rectangle stroke
 72.000  33.000 moveto   82.000  40.000 rectangle stroke
 72.000  27.000 moveto   84.000  33.000 rectangle stroke
[ 1.000   0.500 ] 0 setdash
 91.000  21.000 moveto  99.000  21.000 lineto stroke
  0.113 setlinewidth
 91.000  49.000 moveto  99.000  49.000 lineto stroke
 83.000  40.000 moveto  99.000  40.000 lineto stroke
 85.000  33.000 moveto  99.000  33.000 lineto stroke
 85.000  27.000 moveto  99.000  27.000 lineto stroke
 10.000  21.000 moveto  17.200  21.000 lineto stroke
 10.000  49.000 moveto  17.200  49.000 lineto stroke
 18.000  11.500 moveto  18.000  20.200 lineto stroke
 78.000  11.500 moveto  78.000  20.200 lineto stroke
stroke 
  0.339 setlinewidth
 18.000  10.000 moveto   0.700   0.000 indent 
 78.000  10.000 moveto   0.700   0.000 indent 
 10.000  21.000 moveto   0.700  90.000 indent 
 10.000  49.000 moveto   0.700  90.000 indent 
}
\LabelTeX   30.000  16.000 $P=[a_1,+\infty[{}\times [a_2,b_2[$\ELTX
\LabelTeX   66.000  36.500 $Q_j$\ELTX
\LabelTeX   57.700  34.500 $x_j$\ELTX
\LabelTeX   17.000   6.200 $a_1$\ELTX
\LabelTeX   72.000   6.200 $1/\delta(\infty)$\ELTX
\LabelTeX   90.000   6.200 $b_1=+\infty$\ELTX
\LabelTeX    5.000  20.000 $a_2$\ELTX
\LabelTeX    5.000  48.500 $b_2$\ELTX
\LabelTeX  108.500   6.200 $x$\ELTX
\LabelTeX    6.200  58.000 $y$\ELTX
\LabelTeX   93.600  36.500 $\infty$\ELTX
\EndFig
\centerline{{\bf Fig.~22.} Subdivision pointée d'un pavé $P$ non borné.}
\medskip

{\bf (1.6) Définition.} {\it Une subdivision pointée 
$D=\{(Q_j,x_j)\}_{0\le j<N}$ de $P$ est une famille 
finie de pavés $Q_j$ fermés
dans $P$, d'intérieurs disjoints, tels que $P=\bigcup Q_j$ $($ou, de
façon équivalente, tels que $\ovl P=\bigcup \ovl Q_j)$, avec des 
points marqués $x_j\in\ovl Q_j$. On dit que $D$ est $\delta$-fine si 
$\diam(Q_j)\le  \delta(x_j)$ pour $x_j\ne\infty$, et 
$Q_j\subset V_{\infty,\delta}=\{x\,;\;\Vert x\Vert\ge 1/\delta(\infty)\}$
pour~$x_j=\infty$ {\rm[Fig.~22]}.}
\medskip

Par définition, un pavé $Q_j$ non borné ne peut être marqué
que par le point $x_j=\infty$, et alors le terme $f(x_j)\vol(Q_j)$ de
la somme de Riemann doit être considéré comme nul (bien que le
volume $\vol(Q_j)$ soit infini). Ceci revient à dire que les pavés
$Q_j$ non bornés ne sont jamais pris en compte dans les sommes de
Riemann considérées. L'existence de subdivisions $\delta$-fines
provient de la compacité de $\ovl P$ (ou de 
$\ovl P\ssm V_{\infty,\delta}^\circ$,
si on préfère). Avec ces conventions, la définition
I.2.7 peut être reprise à l'identique.
\medskip

{\bf (1.7) Définition}. {\it Une fonction $f:P\to\bR$ définie
sur un pavé quelconque $P\subset\bR^n$ est dite intégrable au sens de 
Henstock-Kurzweil  $($HK-intégrable$)$ s'il existe un réel $A$  tel 
que pour toute erreur $\varepsilon>0$ donnée a priori, on puisse trouver 
une jauge $\delta:\ovl P\to\bR^*_+$ telle que 
pour toute subdivision pointée $D=\{(Q_j,x_j)\}$ $\delta$-fine de~$P$ on ait
$|S_D(f)-A|\le\varepsilon$. Dans ce cas, on note
$$
A=\int_P f(x)dx,
$$
et on appelle $A$ l'intégrale de $f$ sur $P$.}
\medskip

Il est clair, compte tenu du lemme 1.4 et de la remarque 1.5, que
les valeurs prises par $f$ sur $\partial P$ ne jouent aucun rôle. La
notion d'intégrabilité est inchangée si on passe d'un pavé $P$
à un pavé $P'\subset P$ ayant les mêmes bornes (c'est-à-dire
tel que $\ovl P'=\ovl P$).  Les résultats suivants s'obtiennent avec
des preuves rigoureusement identiques à celles que nous avons
déjà données (cf.\ (II.1.6), (II.1.7)). Nous les énoncerons donc
sans commentaires supplémentaires.
\medskip

{\bf (1.8) Critère de Cauchy.} {\it Pour qu'une fonction  $f:P\to\bR$ soit
HK-intégrable sur un pavé quelconque $P$, il faut et il suffit que
pour tout $\varepsilon>0$ on puisse trouver une jauge $\delta$ sur $P$ 
telle que pour toutes subdivisions
$\delta$-fines $D$, $D'$ de $P$ on ait
$$|S_{D'}(f)-S_D(f)|\le\varepsilon$$
$($et on peut se restreindre, comme on l'a déjà observé, au cas
de subdivisions $D$ et $D'$ telles que $D'$ est 
emboîtée dans $D.)$}\medskip

{\bf (1.9) Proposition.} {\it Soit $f : P\to\bR$ une fonction
HK-intégrable sur un pavé $P$ quelconque.
Alors la restriction $f_{|Q}$ de $f$ à tout pavé $Q$ contenu dans $P$
est encore HK-intégrable.}
\medskip

{\bf (1.10) Proposition (relation de Chasles).} {\it Étant donné un
découpage $P=\bigcup P_i$ d'un pavé $P$ en pavés
$P_i$ d'intérieurs disjoints, une fonction $f:P\to\bR$ est
HK-intégrable sur $P$ si et seulement si elle est intégrable sur
chaque pavé $P_i$, et on a alors
$$
\boxed{16}{
\int_P f(x)\,dx = \sum_i \int_{P_i} f(x)\,dx.}
$$
}

{\bf (1.11) Lemme de Henstock.} {\it Le lemme de Henstock $(1.1)$ est valide
pour un pavé $P$ quelconque.}

Notons maintenant la caractérisation simple suivante, qui montre que
calculer des intégrales HK sur des pavés $P$ non compacts
est la même chose que de calculer ce que l'on appelle parfois des
«\?intégrales impropres\?», à savoir des limites
d'intégrales prises sur des parties compactes adéquates de plus
en plus grandes.\note{16}{Le mot
«\?impropre\?» n'est utilisé que parce que le résultat
correspondant au théorème 1.12 ci-dessous n'est vrai ni pour 
l'intégrale de Riemann ordinaire, ni même pour l'intégrale de
 Lebesgue. Là encore, l'intégrale de Henstock-Kurzweil se révèle
être à la fois plus souple, les intégrales impropres deviennent
des intégrales «\?normales\?»$\,$! Bien entendu -- et
surtout si on se limite à la dimension $1$ -- il est possible
d'alléger l'exposé de la théorie en prenant plutôt le
théorème 1.12 ci-après comme définition de
$\smash{\int_{P}f(x)\,dx}$.}

On considère dans le pavé $P$ les parties $R$ {\it compactes,
pavables et bien remplies} au sens suivant~: une telle partie
$R$ est une réunion finie de pavés compacts $P_i\subset P$ d'inté\-rieurs
disjoints non vides, telle que
le complémentaire $P\ssm R^\circ$ soit lui-même réunion finie de
pavés $Q_j$ fermés dans $P$ et d'intérieurs disjoints, non compacts
(c'est-à-dire non bornés ou adhérents à $\partial P\ssm P$). 
Si $\delta:\ovl P\to\bR^*_+$ est une jauge, est dit que la partie compacte
$R\subset P$ est $\delta$-remplie si on peut trouver des pavés 
marqués $(Q_j,x_j)$ 
$\delta$-fins, fermés dans~$P$, non compacts et d'intérieurs disjoints, 
tels que $P\ssm R^\circ=\bigcup Q_j$.

Par exemple, en dimension~$1$,
si $P=[a,b[$, les parties compactes pavables et bien remplies sont les
intervalles $[a,\beta]$, $\beta\in{}]a,b[$, et cette partie est
$\delta$-remplie dès lors
que~\hbox{$b-\beta\le\delta(b)\,$}: il suffit de marquer
l'intervalle $Q=[\beta,b]$ par le point $b$ pour le voir. En dimension 
plus grande, ces régions peuvent avoir une forme plus compliquée~:

\InsertFig 10.000 65.000 {
1 mm unit
  5.000  10.000 moveto 
105.000   0.000 2.4 vector 
 10.000   5.000 moveto 
 55.000  90.000 2.4 vector
 18.000  54.000 moveto  90.000  54.000 lineto stroke
  0.339 setlinewidth
 18.000  21.000 moveto  
 18.000  49.000 lineto  23.000  49.000 lineto
 23.000  45.000 lineto  30.000  45.000 lineto
 30.000  51.000 lineto  43.000  51.000 lineto
 43.000  47.000 lineto  51.000  47.000 lineto
 51.000  50.000 lineto  63.000  50.000 lineto
 63.000  50.000 lineto  63.000  44.000 lineto
 63.000  44.000 lineto  79.000  44.000 lineto
 79.000  44.000 lineto  79.000  52.000 lineto
 79.000  52.000 lineto  88.000  52.000 lineto
 88.000  41.000 lineto  83.000  41.000 lineto
 83.000  33.000 lineto  89.000  33.000 lineto
 89.000  27.000 lineto  79.000  27.000 lineto
 79.000  21.000 lineto  gsave 0.920 setgray fill 0.000 setgray
 grestore stroke
 18.000  21.000 moveto  18.000  54.000 lineto stroke
 18.000  21.000 moveto  90.000  21.000 lineto stroke
[ 1.000   0.500 ] 0 setdash
 91.000  21.000 moveto  99.000  21.000 lineto stroke
  0.113 setlinewidth
 91.000  54.000 moveto  99.000  54.000 lineto stroke
 10.000  21.000 moveto  17.200  21.000 lineto stroke
 10.000  54.000 moveto  17.200  54.000 lineto stroke
 18.000  11.500 moveto  18.000  20.200 lineto stroke
stroke 
  0.339 setlinewidth
 18.000  10.000 moveto   0.700   0.000 indent 
 10.000  21.000 moveto   0.700  90.000 indent 
 10.000  54.000 moveto   0.700  90.000 indent 
}
\LabelTeX   30.000  16.000 $P=[a_1,+\infty[{}\times [a_2,b_2[$\ELTX
\LabelTeX   17.000   6.200 $a_1$\ELTX
\LabelTeX   88.000   6.200 $b_1=+\infty$\ELTX
\LabelTeX    5.000  20.000 $a_2$\ELTX
\LabelTeX    5.000  53.000 $b_2$\ELTX
\LabelTeX  108.500   6.200 $x$\ELTX
\LabelTeX    6.200  58.000 $y$\ELTX
\LabelTeX   46.200  33.000 $R$\ELTX
\EndFig
\centerline{{\bf Fig.~23.} Partie $R$ compacte, pavable et bien remplie
dans $P$.}
\medskip

Désignons par $\cR(P)$
l'ensemble des parties compactes pavables et bien remplies dans~$P$
et soit $R\in\cR(P)$ une partie $\delta$-remplie. Il est commode de
supposer que $\delta$ vérifie la propriété supplémentaire
$\delta(x)\le{1\over2}d(x,F)$ pour tout face $F$ de $\partial P$ et tout 
$x\in\ovl P\ssm F$ (de sorte qu'on a en particulier 
$\delta(x)\le {1\over 2}d(x,\partial P)$ pour $x\in P^\circ$). En
effet, sous cette hypothèse, tout pavé pointé $(Q_j,x_j)$ tel que
$x_j\in P^\circ$ est compact et contenu dans $P^\circ$, donc pour toute
subdivision pointée $\delta$-fine $D=\{(Q_j,x_j)\}$ de $P$, 
les seuls pavés $Q_j$ non compacts correspondent à des points
que $x_j\in\partial P\cup\{\infty\}$. On voit même que $x_j$ doit
être sur une des faces $F$ de $\partial P\ssm P$, car sinon l'hypothèse
relative à la distance aux faces entraînerait de nouveau que $Q_j$
serait compact. Si on suppose $\sup\delta\le{1\over k}$,
on voit alors que la réunion $R$ des pavés compacts $Q_j\subset P$ 
contient le pavé compact
$$
P_k=\big\{x\in P\,;d(x,\partial P\ssm P)\ge 1/k,\;\Vert x\Vert\le k\big\}
$$
(c'est le pavé des points $x$ dont les coordonnées $x_j$ vérifient
$|x_j|\le k$ et dont la distance est au moins $1/k$ aux faces 
$F=\{x_i=c_i\}$ qui ne sont pas contenues dans $P$). On notera que $(P_k)$ est
une suite croissante de pavés compacts telle que $P=\bigcup P_k$.
\medskip

{\bf (1.12) Théorème de Hake}. {\it Soit $f:P\to\bR$ une fonction
définie sur un pavé quelconque dans $\bR^n$. Il~y~a équivalence
entre
{\parindent=6.5mm
\item{\rm(a)} $f$ est HK-intégrable sur $P$.
\item{\rm(b)}  f est HK-intégrable sur tout pavé compact contenu dans 
$P$ et la limite
$$
\lim_{R\in\cR(P),\,R\to P}\int_R f(x)\,dx\qquad\hbox{existe}
$$
$($la limite étant prise suivant le filtre des parties $R$ compactes
pavables $\delta$-remplies$)$.\vskip0pt}
Dans ce cas, on a
$$
\boxed{16}{
\int_Pf(x)\,dx=\lim_{R\in\cR(P),\,R\to P}\int_R f(x)\,dx}.
$$}
\medskip

{\it Démonstration.} (a)${}\Rightarrow{}$(b). Soit $\varepsilon>0$ et 
$\delta$ une jauge $\varepsilon$-adaptée à $f$ sur $P$. On supposera
en outre que 
$$
\delta(x)\le\cases{
\displaystyle{\varepsilon\,e^{-2n|x|}\over 1+|f(x)|}&lorsque 
$x\in \partial P$,\cr
\noalign{\vskip5pt}
\displaystyle{1\over 2}d(x,\partial P)&lorsque $x\in P^\circ$,\cr}
$$
Si $R$ est une partie compacte pavable $\delta$-remplie, on peut par
définition trouver une subdivision pointée $\delta$-fine
$D=\{(Q_j,x_j)\}_{0\le j<N}$ telle que $R=\bigcup Q_j$ soit la réunion
des pavés $Q_j$ compacts.
Pour les $Q_j$ non compacts, on a nécessairement \hbox{$x_j\in
\partial P\cup\{\infty\}$} comme on l'a déjà vu,
et le terme associé $f(x_j)\vol(Q_j)$ satisfait par suite l'estimation 
du lemme 1.5 (à moins que $x_j=\infty$, auquel cas ce terme est nul).
Ceci donne
$$
\bigg|S_D(f)-\sum_{Q_j\,\hbox{compact}}f(x_j)\vol(Q_j)\bigg|\le 4n\varepsilon
$$
(puisqu'il y a au plus $2n$ faces mises en jeu dans $\partial P\ssm P$). 
Le lemme de Henstock implique par ailleurs
$$
\bigg|\sum_{Q_j\,\hbox{compact}}f(x_j)\vol(Q_j)
-\int_R f(x)\,dx\Bigg|\le\varepsilon.
$$
On obtient donc
$$
\bigg|S_D(f)-\int_R f(x)\,dx\Bigg|\le(4n+1)\varepsilon,
$$
ce qui montre que (b) est vrai.

(b)${}\Rightarrow{}$(a). Posons
$$
A=\lim_{R\in\cR(P),\,R\to P}\int_R f(x)\,dx.
$$
Soit $\varepsilon>0$ et $\hat\delta:\ovl P\to\bR^*_+$ une jauge telle que
$$
\bigg|\int_R f(x)\,dx-A\bigg|\le \varepsilon
$$
pour toute partie compacte pavable $R\in\cR(P)$
$\hat\delta$-remplie. Fixons une suite croissante $R_0\subset
R_1\subset R_2\subset\ldots\;$ de parties compactes pavables telles
que $R_k\supset P_k$, $P=\bigcup R_k$ et
$$
\bigg|\int_{R_k}f(x)\,dx-A\bigg|\le 2^{-k}\varepsilon.
$$
Pour tout $k\ge 0$, la différence $T_k=R_k\ssm R_{k-1}^\circ$
(avec \hbox{$T_0=R_0$}) est pavable par des pavés $Q_{k,\ell}$ en
nombre fini, et on peut trouver des jauges $\delta_{k,\ell}$ sur
$Q_{k,\ell}$ telles que
$$
\bigg|S_{D_k}(f)-\int_{T_k}f(x)\,dx\bigg|\le 2^{-k}\varepsilon
$$
pour toute subdivision pointée $\delta_k$-fine $D_k$ de~$T_k$ obtenue en 
réunissant des subdivisions des $Q_{k,\ell}$. On choisit
maintenant une jauge $\delta$ sur $P$ en prenant 
$\delta(\infty)=\hat\delta(\infty)$ et
$$
\delta(x)=\cases{\displaystyle
\min\Big(\hat\delta(x),
\inf_{Q_{k,\ell}\ni x} \delta_{k,\ell}(x),
{1\over 2}\inf_{F\not\ni x,\,F\subset\partial Q_{k,\ell}} d(x,F)\Big)
&si $x\in P$,\cr
\displaystyle 
\hat\delta(x)&si $x\in \partial P\ssm P$,\cr}
$$
où les $F$ désignent les faces des pavés $Q_{k,\ell}$. Les inf sont bien 
strictement positifs
du fait que la famille des $Q_{k,\ell}$ est localement finie dans $P$.
Soit $D=\{(Q_j,x_j)\}$ une subdivision $\delta$-fine de $P$. 
Les pavés $Q_j$ non-compacts ont pour réunion une partie compacte $R$ 
$\smash{\hat\delta}$-remplie, et on a donc 
$\big|\int_Rf(x)\,dx-A\big|\le\varepsilon$. Or, on a
nécessairement $R\subset R_{k_0}$ pour un certain
$k_0$ assez grand. Le choix de $\delta$ vis à vis de la distance aux faces
des pavés $Q_{k,\ell}$ implique que $D$ induit 
des subdivisions pointées
partielles $D_k$ $\delta_k$-fines des $T_k$ pour un nombre fini de 
parties $T_k$, $k\le k_0$. Par le lemme de Henstock on en déduit
$$
\bigg|S_{D_k}(f)-\int_{R\cap T_k}f(x)\,dx\bigg|\le 2^{-k}\varepsilon,
$$
et, en faisant la somme,
$$
\bigg|S_D(f)-\int_Rf(x)\,dx\bigg|\le \sum 2^{-k}\varepsilon=2\varepsilon.
$$
Ceci entraîne $|S_D(f)-A|\le 3\varepsilon$ et montre que $f$ est HK-intégrable
sur $P$, d'intégrale $\int_Pf(x)\,dx=A$.\qed
\medskip

Bien entendu, comme l'intégrabilité de Henstock-Kurzweil sur $P$ et sur
$P^\circ$ sont équiva\-lentes, on peut tout aussi bien approcher
l'intégrale $\int_Pf(x)\,dx$ par des intégrales $\int_Rf(x)\,dx$
sur des parties compactes $\delta$-remplies $R\subset P^\circ$, si on
le souhaite. En dimension $1$, on a le cas particulier suivant 
beaucoup plus simple du théorème de~Hake.
\medskip

{\bf (1.13) Théorème de Hake (dimension 1)}. {\it Soit
$f:[a,b[{}\to\bR$ une fonction définie sur un intervalle non compact, 
$b\in\bR\cup\{+\infty\}$. Alors $f$ est HK-intégrable sur $[a,b[$ si et
seulement si elle est HK-intégrable sur tout intervalle $[a,\beta]$,
$\beta\in[a,b[$, et si la limite $\lim_{\beta\to b-0}\int_a^\beta f(x)\,dx$
existe. Dans ce cas
$$
\int_a^b f(x)\,dx=\lim_{\beta\to b-0}\int_a^\beta f(x)\,dx.\eqno\square
$$}

En dimension plus grande, une partie de ce résultat est encore valable.
\medskip

{\bf (1.14) Proposition.} {\it Si $f:P\to\bR^n$ est une fonction
HK-intégrable sur un pavé $P$ quelconque, on a
$$
\int_Pf(x)\,dx=\lim_{P'\subset P,\,P'\to P}\int_{P'}f(x)\,dx
$$
où $P'\subset P$ est un pavé quelconque dont les bornes convergent 
vers celles de $P$.
}

{\it Démonstration.} Quitte à prolonger $f$ par $0$ sur $\ovl
P\ssm P$, on peut supposer $P$ fermé dans~$\bR^n$. Il suffit alors
de combiner le résultat du théorème de Hake appliqué à un
pavé compact $P_1\subset\ovl P$ assez grand avec le lemme de
Henstock et les estimations du lemme 1.4 sur le bord $\partial P$. Les
détails sont laissés en exercice pour le lecteur. \qed
\medskip

On notera cependant qu'en dimension${}>1$  la réciproque de la 
proposition 1.14 dans
laquelle on considérerait les seuls pavés compacts $P'\subset P$
$\delta$-remplis n'est pas vraie. Par exemple, la fonction
$f:P\to\bR$ définie sur $P=[0,1]\times\bR$ telle que $f(x,y)=1$ si
$x\in[0,1/2]$ et $f(x,y)=-1$ si $x\in{}]1/2,1]$ est bien HK-intégrable
d'intégrale nulle sur tout pavé $P'=[0,1]\times[0,A]$, mais elle
n'est pas HK-intégrable sur $P$ (puisqu'à l'évidence elle ne
l'est pas sur $Q=[0,1/2]\times\bR$).
\bigskip

\section{2. Fonctions absolument intégrables}

Étant donné une fonction $f$ HK-intégrable sur un pavé $P$,
il peut fort bien se produire que l'intégrale $\int_P|f(x)|\,dx$
soit divergente, en d'autres termes, que la fonction 
$|f|$ ne soit pas HK-intégrable. Un exemple classique est celui de
l'intégrale $\int_0^{+\infty}{\sin x\over x}\,dx$, ou encore
$\int_0^1{1\over x}\sin{1\over x}\,dx$. Ceci justifie la définition
suivante.\medskip

{\bf (2.1) Définition.} {\it On dit qu'une fonction $f:P\to\bR$ 
définie sur un pavé $P\subset\bR^n$ est absolument intégrable sur $P$ 
si à la fois $f$ et $|f|$ sont
HK-intégrables sur $P$, ou, de façon équivalente, si
$f_+=\max(f,0)$ et $f_-=\max(-f,0)$ sont HK-intégrables sur $P$.}

L'équivalence des deux conditions résulte en effet des formules 
immédiates\note{17}{On remarquera qu'il ne suffit pas de 
supposer $|f|$ HK-intégrable dans cette
définition, du moins dans la théorie des ensembles de Zermelo-Fraenkel 
augmentée de l'axiome du choix (ZFC - la théorie la plus couramment 
utilisée~...). Dans cette théorie, il existe en 
effet des parties  $E\subset[0,1]$ qui sont non mesurables, et la fonction 
$\smash{f=\chi_E-\chi_{[0,1]\ssm E}}$ est de valeur absolue $|f|=1$
HK-intégrable sur $[0,1]$, tandis que $f$ n'est pas HK-intégrable.}
$$
f_+={1\over 2}(f+|f|),~~~
f_-={1\over 2}(|f|-f),~~~
f=f_+-f_-,~~~
|f|=f_++f_-.
$$
Si $f$ est absolument intégrable sur $P$, on a
$$
-\int_P f_-(x)\,dx\le
\int_P f(x)\,dx=\int_P f_+(x)\,dx-\int_P f_-(x)\,dx\le
\int_P f_+(x)\,dx,
$$
et comme les membres de droite et de gauche sont majorés par 
$\pm\int_P|f(x)|\,dx$ on en déduit
$$
\Big|\int_P f(x)\,dx\Big|\le\int_P |f(x)|\,dx.\leqno(2.2)
$$
Un critère commode pour l'intégrabilité de $|f|$ est le suivant.\medskip

{\bf (2.3) Critère d'intégrabilité absolue.} {\it Soit $f:P\to \bR$
une fonction HK-intégrable. Alors on a 
$$
\int_P|f(x)|\,dx = \sup_{D}\sum_{0\le j<N}
\Big|\int_{Q_j}f(x)\,dx\Big|
$$
où le sup est pris sur toutes les subdivisions pointées
$D=(Q_j,x_j)_{0\le j<N}$ de $P$, la fonction $|f|$ étant HK-intégrable 
sur $P$ si et seulement si le membre de droite est fini.}

{\it Démonstration.} Si $|f|$ est HK-intégrable, on a d'après (2.2)
$$
\Big|\int_{Q_j}f(x)\,dx\Big|\le\int_{Q_j}|f(x)|\,dx,
$$
donc on voit immédiatement que
$$
\sup_{D}\sum_{0\le j<N}
\Big|\int_{Q_j}f(x)\,dx\Big|\le\int_P|f(x)|\,dx.
$$
Dans l'autre sens, soit $S$ le supremum figurant dans le membre de gauche,
supposé fini. Étant donné $\varepsilon>0$, soit 
$D=\{(Q_j,x_j)\}_{0\le j<N}$ une 
subdivision pointée de $P$ qui réalise le supremum à $\varepsilon$ 
près. On choisit une jauge $\delta$ adaptée à
$\varepsilon$, telle qu'on ait en outre $\delta(x)\le\min_{\partial Q_j\not\ni 
x}d(x,\partial Q_j)$. Toute subdivision $D'=\{(Q'_k,x'_k)\}_{0\le k<N'-1}$ 
\hbox{$\delta$-fine} de $P$ se décompose alors (quitte à redécouper 
si nécessaire les pavés $Q'_k$ tels que $x'_k\in\partial Q_j$) en des 
subdivisions de chacun des pavés $Q_j$ par ceux des pavés $Q'_k$ qui 
sont contenus dans~$Q_j$.
Le lemme de Henstock 1.1~(b) combiné à l'inégalité triangulaire
$||u|-|v||\le|u-v|$ implique
$$
\bigg|\sum_{0\le k<N'-1}\Big(|f(x'_k)|\vol(Q'_k)-\Big|\int_{Q'_k}
f(x)\,dx\Big|\Big)\bigg|\le 2\varepsilon.
$$
Par ailleurs, la formule de Chasles donne que chaque intégrale
$\int_{Q_j}f(x)\,dx$ est la somme des d'intégrales
$\int_{Q'_k}f(x)\,dx$ telles que $Q'_k\subset Q_j$, donc
$$
S-\varepsilon\le \sum_{0\le j<N-1}\Big|\int_{Q_j}f(x)\,dx\Big|\le 
\sum_{0\le k<N'-1}\Big|\int_{Q'_k}f(x)\,dx\Big|\le S.
$$
On en déduit $\smash{\big|\sum_k|f(x'_k)|\,\vol(Q'_k)-S\big|}
\le 3\varepsilon$, 
donc $|f|$ est bien HK-intégrable d'inté\-grale 
$\int_P|f(x)|\,dx=S$.\qed
\medskip

{\bf (2.4) Corollaire.} {\it Si $f,g:P\to\bR$ sont HK-intégrables et si
$|f|\le g$, alors $f$ est absolument intégrable sur~$P$.}

{\it Démonstration.} On applique le critère 2.3, en observant que
$$
\sup_{D}\sum_{0\le j<N-1}
\Big|\int_{Q_j}f(x)\,dx\Big|
\le
\sup_{D}\sum_{0\le j<N-1}
\int_{Q_j}g(x)\,dx\le\int_Pg(x)\,dx<+\infty.\eqno\square
$$

{\bf (2.5) Corollaire.} {\it L'ensemble ${\widetilde L}^1(P)$ des fonctions
absolument intégrables est un espace vectoriel, et l'intégrale de
la valeur absolue
$$
\Vert f\Vert_1=\int_P |f(x)|\,dx
$$
définit une semi-norme sur ${\widetilde L}^1(P)$ , c'est-à-dire que 
$$
\Vert \lambda f\Vert_1=|\lambda|\,\Vert f\Vert_1,~~~
\Vert f+g\Vert_1\le\Vert f\Vert_1+\Vert g\Vert_1
$$
pour tout scalaire $\lambda\in\bR$ et tous $f,g\in{\widetilde L}^1(P)$.}

{\it Démonstration.} L'intégrabilité absolue de $f+g$ découle de
l'inégalité triangulaire $|f+g|\le |f|+|g|$ dans laquelle on sait
que le membre de droite est HK-intégrable. Ceci implique également 
l'inégalité triangulaire pour la semi-norme~$\Vert~~\Vert_1$.\qed
\medskip

{\bf (2.6) Remarque.} $\Vert~~\Vert_1$ n'est pas une norme sur
${\widetilde L}^1(P)$ car il existe des fonctions $f$ non nulles
telles que $\Vert f\Vert_1=0$. Il suffit par exemple qu'il existe un
ensemble dénombrable $E$ tel que $f(x)$ soit nul sur $P\ssm E$. 
On verra au paragraphe 5 comment on peut néanmoins construire
un espace normé complet à partir de ${\widetilde L}^1(P)$.
\medskip

{\bf (2.7) Remarque.} Si $f,g:P\to\bR$ sont HK-intégrables, il
n'est pas vrai en général que $\max(f,g)$ et $\min(f,g)$ sont
intégrables (ce n'est même pas vrai si $g=0\;$!). Cependant,
c'est vrai si $f,g\ge 0$ ou si $f,\,g$ sont absolument
intégrables$\;;$  pour le voir il suffit en effet de poser
$$
\max(f,g)={1\over 2}(f+g)+{1\over 2}|f-g|,\qquad
\min(f,g)={1\over 2}(f+g)-{1\over 2}|f-g|.
$$
Plus généralement, c'est vrai s'il existe une fonction $h$ HK-intégrable 
telle que $h\le f$ et $h\le g$, car on peut alors écrire
$$
\min(f,g)=h+\min(f-h,g-h), \qquad \max(f,g)=h+\max(f-h,g-h),
$$
et de même s'il existe une fonction $h$ HK-intégrable telle que 
$f\le h$ et $g\le h$, car on peut alors écrire
$$
\min(f,g)=h-\max(h-f,h-g), \qquad \max(f,g)=h-\min(h-f,h-g).
$$
\medskip

\section{3. Le théorème de convergence monotone}

L'un des points centraux de la théorie de l'intégration est de
comprendre ce qui se se passe pour la limite d'une suite
d'intégrales de fonctions. Le cas le plus fondamental est celui
d'une suite monotone de fonctions.
\medskip

{\bf (3.1) Théorème.} {\it Soit $f_k:P\to\bR$ une suite croissante de
fonctions HK-intégrables sur un pavé $P\subset\bR^n$, convergeant vers  
$f:P\to\bR$ en tout point de~$P$. Alors $f$ est HK-intégrable sur $P$
si et seulement si la suite croissante $A_k=\int_P f_k(x)\,dx$ est majorée, 
et alors
$$
\int_P f(x)\,dx=\lim_{k\to+\infty}\int_P f_k(x)\,dx.
$$}

{\it Démonstration.} (a) Si $f$ est HK-intégrable sur $P$, alors
$$
A_k=\int_Pf_k(x)\,dx \le \int_Pf(x)\,dx <+\infty,
$$
par conséquent la suite croissante $(A_k)$ est bornée et elle admet une
limite
$$
A=\lim_{k\to+\infty}\int_Pf_k(x)\,dx \le \int_Pf(x)\,dx.
$$
(b) Pour traiter la réciproque et l'inégalité inverse, commençons par 
le cas où $P$ est fermé borné dans $\bR^n$. Supposons
$A=\lim A_k<+\infty$. On se propose alors de montrer
que $f$ est HK-intégrable sur $P$ d'intégrale~$A$. Fixons $\varepsilon>0$.
On peut choisir un entier $k_0$ tel~que
$$
A-\varepsilon\le\int_P f_k(x)\,dx\le A\qquad\hbox{pour $k\ge k_0$}.
$$
Pour chaque indice $n$, choisissons une jauge $\delta_k:P\to\bR^*_+$ 
adaptée à $f_k$
pour une tolérance d'erreur $2^{-k}\varepsilon$. Enfin, pour chaque
$x\in P$, choisissons un indice $K(x)\ge k_0$ tel que
$$
f(x)-\varepsilon\le f_k(x)\le f(x)\qquad\hbox{pour $k\ge K(x)$}.
$$
On définit une jauge $\delta$ sur $P$ par 
$\delta(x)=\delta_{K(x)}(x)$. Soit
$D=\{(Q_i,x_i)\}_{0\le i<N}$ une subdivision pointée $\delta$-fine de $P$.
On peut écrire
$$
\eqalign{
\big|S_D(f)-A\big|&\le
\Big|\sum_{0\le i<N} \big(f(x_i)-f_{K(x_i)}(x_i)\big)\vol(Q_i)\Big|\cr
&\,{}+\Big|\sum_{0\le i<N}\Big(f_{K(x_i)}(x_i)\vol(Q_i)
-\int_{Q_i}f_{K(x_i)}(x)\,dx\Big)\Big|\cr
&\,{}+\Big|\sum_{0\le i<N}
\int_{Q_i}f_{K(x_i)}(x)\,dx-A\Big|.\cr
}
$$
Par définition de $K(x)$, la première somme du membre de droite est
majorée par $\varepsilon\sum\vol(Q_i)=\varepsilon\vol(P)$. 
Comme $K(x_i)\ge k_0$, on voit facilement que la troisième somme 
est majorée par
$$
\Big|\int_Pf_{k_0}(x)\,dx-A\Big|\le\varepsilon.
$$
En effet, grâce à la monotonie de la suite $(f_k)$, on a
$$
\int_Pf_p(x)\,dx\le \sum_{0\le i<N}
\int_{Q_i}f_{K(x_i)}(x)\,dx\le \int_Pf_q(x)\,dx
$$
avec $p=\min(K(x_i))$, $q=\max(K(x_i))$ $q\ge p\ge k_0$.
Reste la deuxième somme du membre de droite. Pour cela, on regroupe les
indices $j$ tels que $K(x_i)$ soit égal à un indice $k$ donné. Le
lemme de Henstock 1.1~(a) implique
$$
\Big|\sum_{K(x_i)=k}\Big(f_k(x_i)\vol(Q_i)-
\int_{Q_i}f_k(x)\,dx\Big)\Big|\le 2^{-k}\varepsilon.
$$
En sommant sur toutes les valeurs de $k$, on voit que la deuxième somme
est majorée par~$2\varepsilon$. Au total nous avons
$|S_D(f)-A|\le\varepsilon(\vol(P)+3)$, par conséquent $f$ est HK-intégrable
d'intégrale $A=\lim_{k\to+\infty}\int_Pf_k(x)\,dx$. Il nous reste
à traiter le cas d'un pavé $P$ non nécessairement borné. 
Quitte à remplacer
$f_k$ par $f_k-f_0$, on peut supposer $f_k\ge 0$ pour tout $k$ (et donc
$f\ge 0$). Dans ce cas, pour toute partie compacte pavable et bien remplie
$R\subset P$,
on a d'après ce qui précède et grâce à la positivité de $f_k$
$$
\int_{R}f(x)\,dx=\lim_{k\to+\infty}\int_{R}f_k(x)\,dx\le
\lim_{k\to+\infty}\int_Pf_k(x)\,dx.
$$
Par conséquent, en faisant tendre $R$ vers $P$ et en utilisant 
le théorème de Hake 1.12, on voit que  $f$ est HK-intégrable
sur $P$ et que
$$
\int_Pf(x)\,dx=\lim_{R\in\cR(P),R\to P}
\int_Rf(x)\,dx\le\lim_{k\to+\infty}\int_Pf_k(x)\,dx<+\infty.
$$
Ceci termine la démonstration.\qed\medskip

{\bf (3.2) Remarque.} On a bien entendu un résultat entièrement analogue
pour les suites décroissantes de fonctions. On le déduit aussitôt en 
remplaçant $(f_k)$ par $(-f_k)$.
\bigskip

\section{4. Mesure de Lebesgue et ensembles négligeables}

Nous commençons par la définition et les propriétés fondamentales de
la mesure de Lebesgue dans $\bR^n$.
\medskip

{\bf (4.1) Théorème et définition.} {\it Si $E$ est une partie
de $\bR^n$, on dit que $E$ est intégrable si sa fonction
caractéristique $\chi_E$ est HK-intégrable sur $P=\bR^n$, et si c'est le
cas, on définit la mesure de Lebesgue de $E$ par
$$
m(E)=\int_{\bR^n}\chi_E(x)\,dx.
$$
La mesure de Lebesgue jouit des propriétés suivantes~:
{\parindent=6.5mm
\item{\rm(a)} Si $E$ et $F$ sont des parties intégrables, alors
$E\cup F$, $E\cap F$, $E\ssm F$ sont intégrables.
Si $E\subset F$, alors $m(E)\le m(F)$.
\item{\rm(b)} Si $(E_k)$ est une suite croissante de 
parties intégrables, $\bigcup E_k$ est intégrable si et seulement si
la suite $m(E_k)$ est bornée, et alors
$m(\bigcup E_k)=\lim m(E_k)$.
\item{\rm(c)} Si $(E_k)$ est une suite décroissante de parties intégrables,
alors $\bigcap E_k$ est intégrable et $m(\bigcap E_k)=\lim m(E_k)$.
\item{\rm(d)} Si $(E_k)_{k\in\bN}$ est une famille de parties intégrables 
deux à deux disjointes, la réunion
$\bigcup E_k$ est intégrable si et et seulement si la série
$\sum m(E_k)$ converge, et alors
$$
m(\bigcup E_k)=\sum m(E_k),
$$
}}

{\it Démonstration.} (a) Il suffit d'appliquer  la remarque 4.7, en 
observant que 
$$
\chi_{E\cup F}=\max(\chi_E,\chi_F),\quad \chi_{E\cap F}=\min(\chi_E,\chi_F),
\quad \chi_{E\ssm F}=\chi_E-\chi_{E\cap F}.
$$
Par ailleurs $E\subset F$ implique $\chi_E\le\chi_F$.

(b) et (c) résultent du théorème de convergence monotone appliqué
à la suite $f_k=\chi_{E_k}$, qui est croissante sous l'hypothèse (b)
et décroissante sous l'hypothèse (c).

(d) On pose $F_k=E_0\cup E_1\cup\ldots\cup E_k$. Alors $F_k$ est intégrable
d'après (a), et comme $\chi_{F_k}=\sum_{0\le i\le n}\chi_{E_i}$ on a bien
$m(F_k)=\sum_{0\le i\le k} m(E_i)$. D'après (b) on obtient
$$
m(\bigcup E_k)=\lim_{k\to+\infty}m(F_k)=\sum_{k=0}^{+\infty}m(E_k),
$$
la suite $m(F_k)$ étant bornée si et seulement si la série converge.\qed
\medskip

{\bf (4.2) Définition.} {\it On dit
\parindent=6.5mm
\item{\rm(a)} qu'une fonction $f:P\to\bR$ est négligeable si 
$|f|$ est intégrable et $\int_P|f(x)|\,dx=0$.
\item{\rm(b)} qu'une partie $E\subset\bR^n$ est négligeable si sa fonction 
caractéristique $\chi_E$ est négli\-geable, autrement dit si $m(E)=0$.
\vskip0pt
}
\medskip

{\bf (4.3) Propriétés des fonctions et ensembles négligeables.} {\it
\parindent=6.5mm
\item{\rm(a)} Si  $f\ge 0$ est négligeable et si $|g|\le f$, alors
$g$ est négligeable. 
\item{\rm(b)} Si $E$ est négligeable, toute partie $F\subset E$ est 
négligeable.
\item{\rm(c)} Toute réunion finie ou dénombrable $\bigcup_{k\ge 0}E_k$ 
de parties négligeables est négligeable.
\item{\rm(d)} Une fonction $f:P\to\bR$ est négligeable si et seulement si 
$E_f=\{x\in P\,;\;f(x)\ne 0\}$ est négligeable.\vskip0pt
}

{\it Démonstration.} (a) résulte aussitôt par passage à la limite de 
la majoration des sommes de Riemann correspondantes 
$\sum |g(x_i)|\,\vol(Q_i)\le \sum f(x_i)\,\vol(Q_i)$.

(b) Si $F\subset E$ on a $0\le \chi_F\le \chi_E$, donc $E$ négligeable 
$\Rightarrow$ $F$ négligeable d'après (a).

(c) Posons $F_k=E_0\cup E_1\cup\ldots\cup E_k$ et $F=\bigcup E_k$. Alors
$0\le\chi_{F_k}\le\chi_{E_0}+\chi_{E_1}+\ldots+\chi_{E_k}$, donc
$\chi_{F_k}$ est négligeable. Le théorème de convergence monotone
montre que la limite croissante $\chi_F=\lim\chi_{F_k}$ est elle
aussi négligeable.

(d) Supposons $f$ négligeable, et soit $g_k(x)=\min(\chi_E(x),k|f(x)|)$.
Alors $(g_k)$ est une sui\-te croissante de fonctions HK-intégrables 
telles que $0\le g_k\le k|f|$ et $\lim g_k=\chi_E$. Elles vérifient donc
$\int_P g_k(x)\,dx=0$, et on obtient
$\int_{\bR^n}\chi_E(x)\,dx=\int_P\chi_E(x)\,dx=0$ par le théorème
de convergence monotone. Inversement si $\chi_E$ est négligeable,
on considère $h_k(x)=\min(|f(x)|,k\chi_E(x))$ qui est une suite
croissante de fonctions négligeables convergeant vers $|f|$ sur~$P$, par 
suite $f$ est négligeable.\qed
\medskip

Il résulte de ce qui précède que les ensembles et fonctions
négligeables ne jouent aucun rôle dans la théorie de
l'intégration. Par exemple, si $f,g:P\to\bR$ diffèrent sur un
ensemble négligeable, alors $f-g$ est négligeable et par suite
l'intégrabilité de $f$ équivaut à celle de $g$ et dans ce cas
$\int_Pf(x)\,dx=\int_Pg(x)\,dx$.  De manière générale, on dit
qu'une propriété $\cP(x)$ dépendant d'un nombre réel $x$ est
vraie presque partout si l'ensemble $E$ des $x$ tels que $\cP(x)$ ne
soit pas vraie est négligeable.  Ces résultats permettent de poser
les définitions suivantes.
\medskip

{\bf (4.4) Espace {\bfit L}${}^1$({\bfit P}$\,$).} L'ensemble $N(P)$ des
fonctions négligeables est un sous-espace vectoriel de l'espace 
${\widetilde L}^1(P)$ des fonctions absolument intégrables. On note
$$
L^1(P)={\widetilde L}^1(P)/N(P)
$$
l'espace quotient. Les classes d'équivalence sont constituées de 
fonctions égales presque partout -- ces classes seront encore notées
comme s'il s'agissait de fonctions, en considérant qu'on s'autorise 
à changer éventuellement leurs valeurs sur un ensemble négli\-geable.
Par définition de la semi-norme $\Vert~~\Vert_1$, nous avons
$\Vert f\Vert_1=0$ si et seulement si $f\in N(P)$, c'est-à-dire
$f=0$ dans $L^1(P)={\widetilde L}^1(P)/N(P)$. Par conséquent
$f\mapsto \Vert f\Vert_1$ définit une vraie norme sur $L^1(P)$.\qed
\medskip

Nous pouvons maintenant énoncer une version nettement renforcée du 
théorème de convergence monotone.
\medskip

{\bf (4.5) Version forte du théorème de convergence monotone.} {\it Soit
$f_k:P\to\bR$ une suite de fonctions HK-intégrables. On suppose que
$(f_k(x))$ est une suite croissante pour presque tout $x\in P$.
{\parindent=6.5mm
\item{\rm(a)} Si $(f_k(x))$ converge presque partout vers une limite
$f(x)$ où $f:P\to\bR$ est une fonction HK-intégrable, alors 
$$
\lim_{k\to+\infty}\int_P f_k(x)\,dx=\int_P f(x)\,dx<+\infty.
$$
\item{\rm(b)} Inversement, si la limite $\lim_{k\to+\infty}\int_P f_k(x)\,dx$
est finie, alors l'ensemble $E$ des réels $x\in P$ tels que
$\lim_{k\to+\infty} f_k(x)=+\infty$ est négligeable. De plus, la 
fonction $f:P\to\bR$ telle que
$$
f(x)=\cases{
\lim_{k\to+\infty}f_k(x)&si $x\notin E$,\cr
0&si $x\in E$\cr}
$$
est HK-intégrable et satisfait {\rm(a)}.\vskip0pt}}

{\it Démonstration.} (a) Soit $E$ l'ensemble des points $x\in P$ tels
que ou bien $(f_k(x))$ n'est pas une suite croissante, ou bien c'est
une suite croissante mais $\lim f_k(x)=+\infty$, ou bien encore 
$f(x)\ne \lim f_k(x)<+\infty$. Par hypothèse, $E$ est un ensemble
négligeable (comme réunion finie d'ensembles négligeables). Quitte 
à redéfinir $f_k(x)$ et $f(x)$ comme étant
égales à $0$ en tout point de $E$, on a
$f(x)=\lim_{k\to+\infty}f_k(x)<+\infty$ partout sur $P$ et on peut alors
appliquer le théorème de convergence monotone 
«\?ordinaire\?» 3.1.

(b) Quitte à redéfinir les $f_k$ par $0$ sur un ensemble négligeable, 
on peut
supposer que la suite $(f_k(x))$ est croissante pour tout~$x\in P$. En
remplaçant $f_k$ par $f_k-f_0$, on peut également supposer $f_k\ge 0$
pour tout $k$. Par hypothèse \hbox{$0\le\int_P f_k(x)\,dx\le M<+\infty$}. 
Pour $k$ et $s$ entiers, $s>0$, soit $E_{k,s}$
l'ensemble des $x\in P$ tels que $f_k(x)>s$. Nous avons
$\chi_{E_{k,s}}=\lim_{N\to+\infty}\min(1,N(f_k-s)_+)$ comme
limite croissante, et de plus 
\hbox{$0\le \chi_{E_{k,s}}\le {1\over s}f_k$},
donc $\chi_{E_{k,s}}$ est intégrable sur~$P$ et
$$
\int_P\chi_{E_{k,s}}(x)\,dx\le {1\over s}\int_Pf_k(x)\,dx\le M/s.
$$
Or $(E_{k,s})_{k\in\bN}$ est une suite croissante d'ensembles dont 
la réunion est l'ensemble $K_s$ des $x\in P$ tels que
$\lim_{k\to+\infty}f_k(x)>s$.  Ceci prouve que $K_s$ est
intégrable et que \hbox{$m(K_s)\le M/s$}.  Maintenant, l'ensemble
$E$ des réels $x\in P$ tels que \hbox{$\lim_{k\to\infty}f_k(x)=+\infty$} 
est l'intersection décroissante $\bigcap_{s\ge 0}K_s$, par suite
$E$ est négligeable. Quitte à
redéfinir $f_k(x)=0$ sur $E$, nous pouvons appliquer le théorème
de convergence monotone ordinaire pour conclure que $f=\lim f_k$ est
HK-intégrable.\qed
\medskip

Désormais, on s'autorisera à écrire des intégrales dans
lesquelles figurent des fonctions qui prennent les valeurs $+\infty$
ou $-\infty$, pourvu que cela soit sur un ensemble négligeable~$E$
-- en fait, si on le souhaite, on pourra toujours redéfinir ces fonctions
comme valant $0$ ou toute autre valeur réelle en chaque
point de~$E$. Dans ce contexte, le théorème de convergence monotone
peut se reformuler comme la
possibilité de commuter intégration et passage à la limite
monotone~:
$$
\boxed{16}{
\hbox{$(f_k)$ monotone}\Rightarrow
\int_P\lim_{k\to+\infty}f_k(x)\,dx
=\lim_{k\to+\infty}\int_P f_k(x)\,dx,}\leqno(4.6)
$$
dès lors que l'un des deux membres est fini.
\bigskip

\section{5. Lemme de Fatou et théorème de convergence dominée}

On déduit ici du théorème de convergence monotone plusieurs autres 
résultats fondamentaux de convergence. Le premier, dit lemme de Fatou, 
est très utile dans bien des situations. 
\medskip

{\bf (5.1) Lemme de Fatou.} {\it Soient $f_k,g:P\to\bR$ des fonctions
HK-intégrables telles que $f_k\ge g$ presque partout. Si
$\liminf_{k\to+\infty} \int_P f_k(x)\,dx<+\infty$, alors la fonction
$f=\liminf_{k\to+\infty} f_k$ est finie presque partout et
HK-intégrable, et on a
$$
\int_P \liminf_{k\to+\infty} f_k(x)\,dx\le
\liminf_{k\to+\infty} \int_P f_k(x)\,dx.
$$}

{\it Démonstration.} Quitte à remplacer $f_k$ par $f_k-g$, on peut supposer
$f_k\ge 0$ (et $g=0$). De manière générale la $\liminf$ d'une suite est
obtenue comme une limite croissante
$$
\liminf_{k\to+\infty}u_k=\lim_{k\to+\infty}\uparrow\inf_{i\in[k,+\infty[}u_i.
$$
Or pour tout $k\ge 0$ nous avons 
$$
\int_P\inf_{i\in[k,+\infty[}f_i(x)\,dx\le
\inf_{i\in[k,+\infty[}\int_P f_i(x)\,dx
$$
puisque l'intégrande $\varphi_k(x)=\inf_{i\in[k,+\infty[}f_i(x)$
du membre de gauche est majoré par $f_i$ pour
chaque $i\in[k,+\infty[$ (de plus $\varphi_k$ est HK-intégrable comme
limite décroissante de la suite $s\mapsto \varphi_{k,s}(x)=
\min_{i\in[k,s]}f_i(x)$ quand $s\to+\infty$).
Le lemme de Fatou résulte maintenant du théorème de convergence monotone
(4.6) appliqué à la suite croissante~$(\varphi_k)$.\qed
\medskip

On a bien entendu l'énoncé symétrique, à savoir que si $f_k\le h$ 
pour tout $k$ avec $h$ HK-intégrable, alors
$$
\int_P \limsup_{k\to+\infty} f_k(x)\,dx\ge
\limsup_{k\to+\infty} \int_P f_k(x)\,dx\leqno(5.2)
$$
pourvu que le second membre ne soit pas $-\infty$. En combinant (5.1) et 
(5.2), on obtient~le
\medskip

{\bf (5.3) Théorème de la convergence encadrée.} {\it Soient $f_k,g,h:P\to\bR$
des fonctions HK-intégrables telles que $g\le f_k\le h$ presque partout.
On suppose que $f(x)=\lim_{k\to+\infty}f_k(x)$ existe presque partout.
Alors $f$ est HK-intégrable sur $P$ et
$$
\lim_{k\to+\infty}\int_P f_k(x)\,dx=\int_P f(x)\,dx.
$$
}

{\it Démonstration.} Le lemme de Fatou donne en effet
$$
\limsup_{k\to+\infty} \int_P f_k(x)\,dx\le
\int_P \lim_{k\to+\infty} f_k(x)\,dx \le
\liminf_{k\to+\infty} \int_P f_k(x)\,dx
$$
puisque $\lim_{k\to+\infty} f_k=\limsup_{k\to+\infty} f_k=
\liminf_{k\to+\infty} f_k$ et que les membres de gauche et de droite sont 
encadrés par $\int_Pg(x)\,dx$ et $\int_Ph(x)\,dx$.\qed
\medskip

{\bf (5.4) Théorème de convergence dominée.} C'est le cas
particulier du théorème de convergence encadrée où la suite
$(f_k)$ vérifie la condition plus forte $|f_k|\le g$ pour une
certaine fonction $g\ge 0$ HK-intégrable. Dans ce cas toutes les
fonctions $f_k$ sont absolument intégrables et la limite $f=\lim
f_k$ vérifie $\Vert f\Vert_1=\lim \Vert f_k\Vert_1$.\note{18}{En
fait les deux théorèmes sont équivalents, puisque le
théorème de la convergence encadrée se ramène au cas de
fonctions${}\ge 0$ en observant que l'on a $0\le f_k-g\le h-g$.}
\medskip

{\bf (5.5) Séries convergentes dans $L^1$.} {\it Soit $f_k:P\to\bR$ 
une suite
de fonctions abso\-lument intégrables telles que
$\sum\Vert f_k\Vert_1<+\infty$. Alors la série $\sum f_k$ converge
dans~$L^1(P)$, et la convergence a lieu également de manière ponctuelle,
presque partout sur~$P$.}

{\it Démonstration.} Posons $S_k=|f_0|+|f_1|+\ldots+|f_k|$. C'est une
suite croissante de fonctions absolument intégrables telles que 
$\int_P S_k(x)\,dx\le \sum\Vert f\Vert_1<+\infty$.
Le théorème de convergence monotone montre que la somme 
$S(x)=\sum|f_k(x)|$ converge presque partout. 
En particulier $\varphi(x)=\sum_{k\ge 0}f_k(x)$ existe presque partout comme
somme d'une série absolument convergente, et le théorème de convergence
dominée appliqué aux sommes partielles $\varphi_k=f_0+f_1+\ldots+f_k$
entraîne que $\varphi$ est absolument intégrable, du fait que
$0\le|\varphi_k|\le S$. Nous avons de plus
$|\varphi-\varphi_k|\le\sum_{i\in[k+1,+\infty[}|f_k|$ donc
$\Vert\varphi-\varphi_k\Vert_1\le\sum_{i\ge k+1}\Vert f_i\Vert_1$, 
et par conséquent $\lim_{k\to+\infty}\Vert\varphi-\varphi_k\Vert_1=0$.\qed
\medskip

Comme conséquence immédiate, nous avons le\medskip

{\bf (5.6) Théorème.} {\it $L^1(P)$ est un espace de Banach 
$($c'est-à-dire un espace normé complet$)$. De plus, de toute suite
de Cauchy $($donc $L^1$-convergente$)$, on peut extraire une sous-suite 
convergeant ponctuellement presque partout sur~$P$.}

{\it Démonstration.} C'est une conséquence purement formelle de (5.5).
Soit $(u_k)$ une suite de Cauchy dans $L^1(P)$. Il existe une sous-suite
$(u_{k_i})$ telle que $\Vert u_{k_{i+1}}-u_{k_i}\Vert_1\le 2^{-i}$. Ceci
implique que la série $\sum_i(u_{k_{i+1}}-u_{k_i})$ converge normalement 
vers une somme $S$ dans $L^1(P)$, et~donc que
la sous-suite $(u_{k_i})$ converge vers $u=S+u_{k_0}$ en norme $L^1$
et presque partout. Il en résulte que la suite $(u_k)$ converge elle 
aussi vers~$u$, en norme~$L^1$.\qed
\medskip

On peut tirer du théorème de convergence encadrée des propriétés 
très agréables de continuité et de dérivabilité sous le signe somme 
des intégrales dépendant de para\-mètres qui généralisent les
résultats du Chapitre I, \S$\,$8.\note{19}{Comme on va le
voir, on peut le faire sous des conditions même plus générales  que 
dans la théorie de Lebesgue, avec des intégrales non nécessairement
absolument convergentes -- on profite en cela de ce que la convergence 
encadrée est plus générale que la convergence dominée. 
Les preuves sont cependant identiques.}
\medskip

{\bf (5.7) Théorème.} {\it Soit $P\subset\bR^n$ un pavé, $T$ une 
partie de $\bR^d$ et $t_0$ un point de l'adhérence de $T$
dans $\bR^d$. Soit $f: P\times T\to\bR$, $(x,t)\mapsto f(x,t)$ une 
fonction telle que
{\parindent=6.5mm
\item{\rm(a)} Pour tout $t\in T$, l'application $P\ni x\mapsto f(x,t)$ 
est HK-intégrable sur $P\;;$
\item{\rm(b)} Il existe des fonctions $g,h:P\to\bR$ HK-intégrables et
un voisinage $V$ de $t_0$ tel que $g(x)\le f(x,t)\le h(x)$ pour tout
$t\in T\cap V$ et presque tout $x\in P$ $($l'ensemble négligeable 
$N(t)\subset P$ correspondant peut dépendre de $t)$. 
\item{\rm(c)} Pour presque tout $x\in P$, l'application $T\ni t\mapsto f(x,t)$ 
possède une limite $\varphi(x)$ quand $t\to t_0$.\vskip0pt}%
Alors $\varphi$ est HK-intégrable sur $P$ et
$$
\lim_{T\ni t\to t_0}\int_P f(x,t)\,dx = \int_P\varphi(x)\,dx.
$$

{\bf (5.8) Continuité sous le signe somme.} Sous les hypothèses $5.7$ 
{\rm(a,$\;$b)}, 
si $t_0\in T$ et si $T\ni t\mapsto f(x,t)$ est continue en $t_0$ pour 
presque tout $x\in P$, on a 
$$
\lim_{T\ni t\to t_0}\int_P f(x,t)\,dx =\int_P f(x,t_0)\,dx,
$$
c'est-à-dire que l'application $F(t)=\int_P f(x,t)\,dx$ 
est continue en $t_0$.
}

{\it Démonstration de $(5.7)$.} Il suffit de montrer qu'il y a
convergence pour toute suite $t_k\in T$ tendant vers $t_0$. Or par
hypothèse, nous avons $\varphi_k(x)=f(x,t_k)\to\varphi(x)$ sauf sur un
ensemble négligeable $E\subset P$, tandis que $g(x)\le\varphi_k(x)\le
h(x)$ en dehors de~$N(t_k)$. Il~suffit d'appliquer le théorème de
convergence encadrée, les hypothèses étant satis\-faites en dehors de
l'ensemble négligeable $E'=E\cup \bigcup N(t_k)$.\qed
\medskip

{\bf (5.9) Dérivation sous le signe somme.}
{\it Soient $P\subset\bR^n$ un pavé, $T\subset\bR$ un intervalle, 
$t_0\in T$ un point fixé et $f: P\times T\to\bR$, $(x,t)\mapsto f(x,t)$ une 
fonction tels que
{\parindent=6.5mm
\item{\rm(a)} pour tout $t\in T$, l'application $P\ni x\mapsto f(x,t)$ 
est HK-intégrable sur $P\;;$
\item{\rm(b)} pour presque tout $x\in P$, l'application $t\mapsto f(x,t)$ 
admet une dérivée partielle ${\partial f\over\partial t}(x,t)$ sur $T$, et
celle-ci est continue en $t_0\in T\;;$
\item{\rm(c)} il existe un voisinage $V$ de 
$t_0$ et des fonctions $g,h:P\to\bR$ HK-intégrables telles que 
$g(x)\le {\partial f\over\partial t}(x,t)\le h(x)$ pour tout
$t\in T\cap V$ et presque tout $x\in P$ $($l'ensemble négligeable 
$N(t)\subset P$ correspondant peut dépendre a priori de $t)$.\vskip0pt}
Alors l'application $F(t)=\int_P f(x,t)\,dx$ est différentiable au point
$t_0$ et on a
$$
\boxed{16}{
F'(t_0)=\int_P {\partial f\over\partial t}(x,t_0)\,dx.}
$$
De plus si $t\mapsto {\partial f\over\partial t}(x,t)$ est continue sur $T$ 
pour presque tout $x\in P$, alors $F$ est de classe $C^1$ sur $T$ 
et la formule ci-dessus a lieu pour tout $t_0\in T$.
}

{\it Démonstration.} En appliquant le théorème des accroissements finis
à $t\mapsto f(x,t)$, on voit que
$$
{F(t)-F(t_0)\over t-t_0}=
\int_P {f(x,t)-f(x,t_0)\over t-t_0}\,dx=
\int_P {\partial f\over\partial t}(x,c_{t,x})\,dx
$$
pour un certain point $c=c_{t,x}\in{}]t_0,t[$. Soit 
$V={}]t_0-\varepsilon,t_0+\varepsilon[$ tel que (c) ait lieu, et soit $(t_k)$ 
une suite de points de $V$ convergeant vers $t_0$. L'hypothèse
(c) est vérifiée pour tout $x\in P\ssm N'$ et $t\in\{t_k\}$, avec
$N'=\bigcup N(t_k)$. Soit $E$ un ensemble négligeable en dehors duquel
(b) a lieu. Lorsque $x\in P\ssm(E\cup N')$ et $t=t_k$ nous avons
$$
g(x)\le {\partial f\over\partial t}(x,c_{t_k,x})\le h(x)\quad\hbox{et}\quad
{\partial f\over\partial t}(x,c_{t_k,x})\to {\partial f\over\partial t}(x,t_0).
$$
Le résultat découle alors de nouveau du théorème de convergence 
encadrée.\qed
\medskip

Pour un paramètre $t=(t_1,\ldots, t_d)\in\bR^d$, nous avons le résultat
analogue suivant.
\medskip

{\bf (5.10) Différentiabilité sous le signe somme.}
{\it Soit $P\subset\bR^n$ un pavé et $T\subset\bR^d$ un ouvert.
Soit $f: P\times T\to\bR$, $(x,t)\mapsto f(x,t)$ une 
fonction telle que
{\parindent=6.5mm
\item{\rm(a)} pour tout $t\in T$, l'application $P\ni x\mapsto f(x,t)$ 
est HK-intégrable sur $P\;;$
\item{\rm(b)} pour presque tout $x\in P$, l'application $t\mapsto f(x,t)$ 
admet des dérivées partielles ${\partial f\over\partial t_j}(x,t)$ 
continues sur $T\;;$
\item{\rm(c)} pour tout point $t_0\in T$, il existe un voisinage $V$ de 
$t_0$ et des fonctions $g_j,h_j:P\to\bR$ HK-intégrables telles que 
$g_j(x)\le {\partial f\over\partial t_j}(x,t)\le h_j(x)$ pour tout
$t\in T\cap V$ et presque tout $x\in P$ $($l'ensemble négligeable 
$N_j(t)\subset P$ correspondant peut dépendre a priori de $t)$.\vskip0pt}
Alors l'application $F(t)=\int_P f(x,t)\,dx$ est différentiable sur $T$
et on a
$$
\boxed{16}{{\partial F\over\partial t_j}(t)=
\int_P {\partial f\over\partial t_j}(x,t)\,dx.}
$$}
\medskip

\section{6. Lemme de recouvrement de Vitali et différentiabilité pres\-que 
partout des intégrales indéfinies}
\sectionrunning{6. Lemme de recouvrement de Vitali et différentiabilité 
des intégrales indéfinies}

Nous commençons par un lemme de recouvrement très utile, puis nous en
donnons quelques applications fondamentales. On définit {\it l'aspect}
$\aspect(P)$ d'un pavé $P$ de $\bR^n$ d'intérieur non vide comme étant
le rapport entre sa plus grande et sa plus petite arête.
\medskip

{\bf (6.1) Lemme de recouvrement de Vitali.} {\it Soit 
$\cV=\{Q_\alpha\}_{\alpha\in A}$ une
famille de pavés fermés contenus dans un pavé
fermé borné $P$, et soit $E$ une partie de~$P$. On
dit que $\cV$ est un recouvrement de Vitali de $E$ si~:
{\parindent=6.5mm
\item{\rm(a)} L'aspect des pavés $Q_\alpha$  reste encadré par deux
constantes positives, c'est-à-dire qu'il existe une constante $C\ge 1$
telle que $\aspect(Q_\alpha)\le C$ pour tout $\alpha$.
\item{\rm(b)} pour tout $x\in E$ et tout $\varepsilon>0$, il existe 
un pavé $Q\in\cV$ tel que $x\in Q$ et $\diam(Q)<\varepsilon$.\vskip0pt}
Alors$\;:$
{\parindent=6.5mm
\item{\rm(i)} il existe une famille finie ou
dénombrable $Q_k$ de pavés deux à deux disjoints de $\cV$
et une partie négligeable $N$ de $P$ telles que
$E\subset\bigcup_{k\ge 0}Q_k\cup N\;;$
\item{\rm(ii)} on~peut de plus choisir $N$ contenu
dans une intersection $\bigcap_{s\ge 0}\bigcup_{k\ge s}Q'_k$
avec des pavés fermés $Q'_k\subset P$ tels que
$\sum_{k\ge 0}m(Q'_k)<+\infty$.\vskip0pt}
}

{\it Démonstration.} On définit par récurrence $Q_0$, $Q_1$, 
$\ldots$, $Q_k$ comme suit. On pose
$$
F_0=\emptyset,\qquad F_k=Q_0\cup Q_1\cup\ldots\cup Q_{k-1}~~\hbox{si $k\ge 1$},
$$
et on considère $\cV_{E,k}\subset\cV$ la 
sous-famille des pavés $Q\in\cV$ tels que $Q$ contienne un point 
$x\in E$ et $Q\subset P\ssm F_k$. S'il existe un entier $k$ tel que 
$E\ssm F_k=\emptyset$ pour un certain~$k$, alors la famille finie 
$(Q_0,\ldots,Q_{k-1})$ répond à la question et le lemme est démontré
avec $N=\emptyset$.
Sinon $E\ssm F_k\ne\emptyset$ pour tout $k\ge 0$ et alors la famille 
$\cV_{E,k}$ est non vide~: en effet, $x\in E\ssm F_k$ étant fixé,
il existe des pavés $Q\in\cV$ contenant $x$ vérifiant
$\diam(Q)<\varepsilon=d(x,F_k)$, de sorte qu'on a nécessairement
$Q\subset P\ssm F_k$. Soit $\mu_k$ le sup de la mesure $m(Q)$ de tous les
pavés $Q\in\cV_{E,k}\;$; on choisit $Q_k\in\cV_{E,k}$
en sorte que $m(Q_k)\ge{1\over 2}\mu_k$. Les pavés $Q_k$ sont bien
disjoints par construction, et on~a par conséquent
$\sum m(Q_k)\le m(P)<+\infty$, donc $\sum\mu_k\le 2\sum m(Q_k)<+\infty$. 

Nous allons montrer que $N=E\ssm\bigcup_{k\ge 0}Q_k$ est négligeable. 
Soit $x\in N$. Pour tout entier~$s$, on a $x\in E\ssm F_s$, et 
il existe un pavé $Q\in \cV$ de diamètre $\diam(Q)<d(x,F_s)$ contenant $x$. 
Par suite $Q\subset P\ssm F_s$. Or, si
\hbox{$Q\subset P\ssm F_k$}, alors $Q\in\cV_{E,k}$ et
$m(Q)\le \mu_k$ par définition de $\mu_k$. Comme $\lim\mu_k=0$ ceci
ne peut se produire que pour un nombre fini d'indices $k$. Choisissons
le plus grand indice $k$ possible, de sorte que $k\ge s$, 
$Q\subset P\ssm F_k$
et $Q\cap F_{k+1}\ne\emptyset$. Ceci implique que $Q\cap Q_k\ne\emptyset$.
Si $a$ est la plus grande arête de $Q$ et $b_k$ la plus petite de $Q_k$
nous avons
$$
a^n\le C^{n-1}m(Q),\qquad m(Q)\le\mu_k\le 2\,m(Q_k),\qquad
m(Q_k)\le C^{n-1}b_k^n,
$$
par 
conséquent que $a\le C_1b_k$ avec $C_1=2^{1/n}C^{2-2/n}$. Ceci entraîne
que $Q$ est contenu dans le pavé $Q'_k$ de même centre que $Q_k$ et
homothétique dans le rapport $C_2=1+2C_1$, par suite
$m(Q'_k)\le C_3\,m(Q_k)$ avec $C_3=C_2^n=(1+2^{1+1/n}C^{2-2/n})^n$.
Nous avons par conséquent
$N\subset\bigcup_{k\ge s}Q'_k$ et comme ceci est vrai pour tout entier
$s$ on voit que $N\subset\bigcap_{s\ge 0}\bigcup_{k\ge s}Q'_k$. Cependant
$$
\sum_{k\ge 0}m(Q'_k)\le C_3 \sum_{k\ge 0}m(Q_k)\le C_3 m(P)<+\infty
$$
et donc $m(\bigcup_{k\ge s}Q'_k)\le \sum_{k\ge s}m(Q'_k)\to 0$ quand
$s\to+\infty$. Par conséquent $N$ est négligeable et (i) est démontré.
Pour obtenir (ii), il suffit de remplacer éventuellement $Q'_k$ par
$Q'_k\cap P$ pour avoir à coup sûr $Q'_k\subset P$.\qed
\medskip

{\bf (6.2) Théorème.} {\it Soit $E\subset\bR^n$ une partie intégrable.
Alors pour tout $\varepsilon>0$ il existe une réunion de cubes
ouverts $U=\bigcup_{k\ge 0}Q_k$ contenant $E$ telle que 
$$
m(U)\le \sum_{k\ge 0}m(Q_k) \le m(E)+\varepsilon.
$$}

{\it Démonstration.} (1) Commençons par le cas où $E$ est borné,
$E\subset P$ pavé fermé borné. Soit $\varepsilon>0$ et $\delta$ une 
jauge $\varepsilon$-adaptée
à $f=\chi_E$ sur $P$. On considère la famille de pavés fermés
$$
\cV_\delta=\big\{Q~\hbox{cube fermé}\subset P\,;\;
\exists x\in E,\;Q\ni x\;\hbox{et}\;\diam(Q)\le\delta(x)\big\}.
$$
C'est un recouvrement de Vitali de $E$. Il existe par conséquent des 
cubes fermés disjoints $Q_k\in\cV_\delta$ et un ensemble
négligeable $N$ tels que $E\subset\bigcup_{k\ge 0}Q_k\cup N$,
avec de plus $N\subset\bigcup_{k\ge 0}Q'_k$, 
$\sum_{k\ge 0}m(Q'_k)\le\varepsilon$. Soit $x_k\in E$ tel que
$x_k\in Q_k$ et $\diam(Q_k)\le\delta(x_k)$.

Grâce au lemme~1.3, la famille finie d'intervalles pointés disjoints
$(Q_k,x_k)_{0\le k\le s}$ peut être complétée en une subdivision
$\delta$-fine $D$ de~$P$. Comme $x_k\in E$, on en déduit
$$
\sum_{k=0}^s m(Q_k)=
\sum_{k=0}^s\chi_E(x_k)\vol(Q_k)\le S_D(\chi_E)\le
\int_P\chi_E(x)\,dx+\varepsilon=m(E)+\varepsilon.
$$
Quand $s\to+\infty$, il vient à la limite $\sum_{k\ge 0} m(Q_k)\le 
m(E)+\varepsilon$, donc quitte à remplacer $Q_k$ et $Q'_k$ par des cubes 
ouverts $\tilde Q_k\supset Q_k$, $\;\tilde Q'_k\supset Q'_k$ tels que 
\hbox{$m(\tilde Q_k)\le m(Q_k)+2^{-k-1}\varepsilon$},
\hbox{$m(\tilde Q'_k)\le m(Q'_k)+2^{-k-1}\varepsilon$}, il vient
$$ 
E\subset
\bigcup_{k\ge 0}\tilde Q_k\cup\tilde Q'_k,\qquad
\sum_{k\ge 0}m(\tilde Q_k)+m(\tilde Q_k)\le m(E)+4\varepsilon.
$$
Quitte à remplacer $\varepsilon$ par $\varepsilon/4$, le résultat est 
démontré dans le cas où $E$ est borné.
\bigskip

\vbox{%
(2) Dans le cas général $E\subset\bR^n$, on écrit $E=\bigcup_{k\in\bZ^n}
E\cap P_k$ où $P_k=k+[0,1[^n$, et on trouve pour chaque $k\in\bZ^n$ un 
ouvert $U_k$ contenant $E\cap P_k$ et des cubes ouverts $Q_{k,\ell}$ le
recouvrant tels que
$$
m(U_k)\le \sum_\ell m(Q_{k,\ell}) \le 
m(E\cap P_k)+2^{-\Sigma(k_i+1)}\varepsilon.
$$
Alors $U=\bigcup U_k$ contient $E$ et on a $m(U)\le 
\sum_{k,\ell}m(Q_{k,\ell)}\le m(E)+\varepsilon$.
\qed}
\medskip

{\bf (6.3) Corollaire.} {\it Soit $E$ une partie de $\bR^n$. Les 
propriétés suivantes sont équi\-valentes.
{\parindent=6.5mm
\item{\rm(a)} $E$ est négligeable.
\item{\rm(b)} Pour tout $\varepsilon>0$, il existe une suite finie ou
dénombrable de cubes $($resp.\ pavés$)$ ouverts $(Q_k)_{k\ge 0}$ tels que
$E\subset\bigcup_{k\ge 0}Q_k$ et $\sum_{k\ge 0}m(Q_k)\le\varepsilon$.
\item{\rm(c)} Pour tout $\varepsilon>0$, il existe une suite finie ou
dénombrable de cubes $($resp.\ pavés$)$ fermés $(Q_k)_{k\ge 0}$ tels que
$E\subset\bigcup_{k\ge 0}Q_k$ et $\sum_{k\ge 0}m(Q_k)\le\varepsilon$.\vskip0pt
}}
\medskip

{\it Démonstration.} (a)${}\Rightarrow{}$(b) grâce à 6.2, tandis que 
(b)${}\Rightarrow{}$(c) est évident, et (c)${}\Rightarrow{}$(a)
en prenant une intersection dénombrable avec $\varepsilon=1/s\to 0$,
$s\in\bN^*$.\qed
\medskip

{\bf (6.4) Théorème de Lebesgue-Denjoy.} {\it Soit $f:P\to\bR$ une 
fonction
HK-intégrable sur un pavé $P\subset\bR^n$ et $\cV_{P,C}$ l'ensemble des
pavés $Q\subset P$ tels que $\aspect(Q)\le C$. Alors pour presque tout
$x\in P$ on a
$$
\boxed{16}{
\lim_{\cV_{P,C}\ni Q\ni x,\,\diam(Q)\to 0}{1\over\vol(Q)}\int_Q f(t)\,dt
=f(x).}\leqno(*)
$$}

{\it Démonstration.} Comme nous allons le voir, il s'agit d'une
conséquence directe du lemme de Henstock, combiné avec le lemme
de recouvrement de Vitali.

Soit $E$ l'ensemble des points $x\in P$ pour lesquels la limite $(*)$ 
n'existe pas, ou bien vaut une certaine valeur $\ell(x)\ne f(x)$.
Il s'agit de montrer que $E$ est négligeable.
Écrivons $E=\bigcup_{s>0} K_s$, où 
$K_s$ est l'ensemble des points $x\in P$ tels que pour tout $\eta>0$
il existe $Q\in\cV_{P,C}$ tel que $Q\ni x$, $\diam(Q)\le\eta$ et
$$
\bigg|f(x)-{1\over\vol(Q)}\int_Q f(t)\,dt\bigg|\ge{1\over s}.
$$
Fixons $\varepsilon>0$ et $\delta$ une jauge $\varepsilon$-adaptée
à~$f$.  On observe que la famille $\cV_{P,C,s,\delta}$ des pavés pointés
$(Q,x)$ vérifiant la minoration précédente et tels que
$\diam(Q)\le\delta(x)$ fournit un recouvrement de Vitali de $K_s$. Il existe
par conséquent une famille finie ou dénombrable $(Q_k,x_k)$
de pavés de $\cV_{P,C,s,\delta}$ (qui dépend aussi 
de $\varepsilon$ via $\delta$) et un ensemble négligeable 
$N_{s,\varepsilon}$ tels que
$K_s\subset R_{s,\varepsilon}:=\bigcup_k Q_k\cup N_{s,\varepsilon}$.
Le lemme de Henstock 1.1~(b) appliqué à la famille finie
de pavés pointés $\{(Q_k,x_k)\}_{0\le k\le m}$ donne
$$
\sum_{0\le k\le m}\bigg|f(x_k)-{1\over\vol(Q_k)}\int_{Q_k}f(t)\,dt\bigg|
\vol(Q_k)\le 2\varepsilon
$$
puisque cette famille est $\delta$-fine par construction. On en déduit
$\sum_{0\le k\le m}{1\over s}\vol(Q_k)\le 2\varepsilon$ pour tout $m$, donc
$m(R_{s,\varepsilon})=m(\bigcup_{k\ge 0}Q_k)\le 2s\,\varepsilon$. 
En écrivant \hbox{$K_s\subset\bigcap_{k>0}R_{s,1/k}$} on voit que 
l'ensemble $K_s$ est négligeable, donc $E=\bigcup_{s>0}K_s$
l'est aussi.\qed
\medskip

{\bf (6.5) Corollaire.} {\it Soit $f:[a,b]\to\bR$ une fonction
HK-intégrable et $F(x)=\int_a^xf(t)\,dt$ son intégrale
indéfinie. Alors $F$ est presque partout dérivable de dérivée
$F'(x)=f(x)$.}
\medskip

{\it Démonstration.} C'est un corollaire immédiat du théorème précédent
en choisissant des pavés $Q$ de la forme $[x,x+h]$ (resp.\ $[x-h,x]$), de
sorte que
$$
{1\over\vol(Q)}\int_Q f(t)\,dt={F(x+h)-F(x)\over h},\qquad\hbox{resp.}~
{F(x)-F(x-h)\over h}.\eqno\square
$$
\bigskip

\section{7. Ensembles et fonctions mesurables}

Une fonction intégrable peut être extrêmement irrégulière du
point de vue de la continuité (par exemple $\chi_\bQ$ est
HK-intégrable sur $\bR$, bien qu'elle soit discontinue en tout point).
Une fonction intégrable doit tout de même satisfaire certaines 
propriétés
très faibles de régularité locale, pour lesquelles les ensembles
négligeables ne jouent aucun rôle. C'est précisément l'objet
de la notion de mesurabilité.\medskip

{\bf (7.1) Définition.} {\it On dit qu'une partie $E\subset\bR^n$ est
mesurable si $E\cap P$ est inté\-grable pour tout pavé fermé 
borné $P\subset\bR$.}

Compte tenu des propriétés des ensemble intégrables (cf.\ (4.1)),
on peut bien entendu se limiter à vérifier que l'intersection 
$E\cap [-k,k]^n$ est intégrable pour tout entier $k$. 
Le théorème suivant découle
immédiatement de (4.1).  \medskip

{\bf (7.2) Théorème.} {\it Toute réunion dénombrable
$\bigcup E_k$, toute intersection dénombrable $\bigcap E_k$ de parties
mesurables $E_k$ est mesurable. Le complémentaire $\complement E$
d'une partie mesurable $E$ est mesurable. Tout pavé, toute 
partie ouverte ou fermée $E\subset \bR^n$ est mesurable.}
\medskip

La dernière assertion résulte du fait que les pavés sont
trivialement mesurables, et du fait qu'une partie ouverte
de $\bR^n$ est réunion finie ou dénombrable de pavés ouverts.
On peut étendre la mesure de Lebesgue aux parties mesurables en
posant
$$
m(E)=\lim_{k\to+\infty}m(E\cap[-k,k]^n),\qquad m(E)\in [0,+\infty].
$$
Les parties intégrables sont alors exactement les parties mesurables
de mesure\break \hbox{$m(E)<+\infty$}, et la propriété d'additivité
de la mesure d'une réunion dénombrable de parties mesu\-rables disjointes 
est encore valable lorsque les sommations sont prises dans~$[0,+\infty]$.
Nous avons la caractérisation suivante assez claire de la mesurabilité.
\medskip

{\bf (7.3) Caractérisation des ensembles mesurables.} {\it Soit $E$ 
une partie de $\bR^n$. Les propriétés suivantes sont équivalentes.
{\parindent=6.5mm
\item{\rm(a)} $E$ est mesurable.
\item{\rm(b)} Pour tout $\varepsilon>0$
il existe une partie fermée $F$ et une partie ouverte $U$ telles que
$F\subset E\subset U$ et $m(U\ssm F)\le\varepsilon$.
\item{\rm(c)} Il existe $F$ un $F_\sigma$ $(={}$réunion finie ou dénombrable
de fermés$)$ et $G$ un $G_\delta$ $(={}$intersection finie ou dénombrable
d'ouverts$)$ tels que $F\subset E\subset G$ et $m(G\ssm F)=0$.
\item{\rm(d)} $E$ peut s'écrire comme une réunion $E=F\cup N$
d'un $F_\sigma$ et d'une partie négligeable.\vskip0pt}
}
\medskip

{\it Démonstration.} (a)${}\Rightarrow{}$(b). Commençons par le cas où
$E$ est borné, $E\subset P$ pavé fermé borné. Alors $E$ et 
$E'=P\ssm E$ sont des
parties intégrables. D'après le théorème (6.2) il existe des ouverts
$U$ et $U'$ de $\bR^n$ tels que $E\subset U$, $m(U\ssm E)\le\varepsilon/2$,
et $E'\subset U'$, $m(U'\ssm E')\le\varepsilon/2$. On pose $F=P\ssm U'$.
Il vient $F\subset P\ssm E'=E\subset U$ et
$$
m(U\ssm F)\subset m(U\ssm E)+m(E\ssm F)\le m(U\ssm E)+m(U'\ssm E')\le
\varepsilon.
$$
Dans le cas général, on pose $E_k=E\cap Q_k$, $Q_k=k+[0,1]^n$,
$k\in\bZ^n$, et on trouve des parties 
fermées $F_k\subset Q_k$ et ouvertes $U_k\subset\bR^n$ telles que 
$F_k\subset E_k\subset U_k$ et $m(U_k\ssm F_k)\le 
2^{-\Sigma(k_i+1)}\varepsilon$.
Alors $F=\bigcup F_k$ et $U=\bigcup U_k$ répondent à la question
puisque $U\ssm F\subset\bigcup(U_k\ssm F_k)$.

(b)${}\Rightarrow{}$(c). Pour tout entier $s>0$, on peut trouver
un fermé $F_s$ et un ouvert $U_s$ tels que $F_s\subset E\subset U_s$
et $m(U_s\ssm F_s)<1/s$. Alors $F=\bigcup F_s$ et $G=\bigcup U_s$
répondent à la question, puisque $G\ssm F\subset U_s\ssm F_s$
pour tout~$s$.

(c)${}\Rightarrow{}$(d) est évident, il suffit de poser
$N=E\ssm F$ qui est contenu dans $G\ssm F$, donc négligeable.

(d)${}\Rightarrow{}$(a) résulte de (7.2).\qed
\medskip

{\bf (7.4) Théorème et définition.} {\it Soit $f:P\to\ovl\bR
=\bR\cup\{+\infty,-\infty\}$ une fonction quelconque définie sur
un pavé $P\subset\bR^n$. Les propriétés
suivantes sont équivalentes.
{\parindent=6.5mm
\item{\rm(a)} L'image réciproque $f^{-1}([-\infty,c[)$ de tout
intervalle ouvert de $\ovl\bR$ est mesurable.
\item{\rm(b)} L'image réciproque $f^{-1}([-\infty,c])$ de tout
intervalle fermé de $\ovl\bR$ est mesurable.
\item{\rm(c)} L'image réciproque $f^{-1}(J)$ de tout
intervalle $J\subset\ovl\bR$ est mesurable, respectivement 
$[({\rm c}')$ $J$ ouvert$\;]$, $[({\rm c}'')$ $J$ fermé$\;]$,
\item{\rm(d)} L'image réciproque $f^{-1}(U)$ de tout
ouvert $U\subset\ovl\bR$ est mesurable.\vskip0pt}
On dit alors que la fonction $f$ est mesurable.
}

{\it Démonstration.} L'équivalence de (a) et (b) résulte des égalités
$$
f^{-1}([-\infty,c])=\bigcap_{n>0} f^{-1}([-\infty,c+1/n[),\quad
f^{-1}([-\infty,c[)=\bigcup_{n>0} f^{-1}([-\infty,c-1/n])
$$
si $c\in\bR$. Le passage au cas d'intervalles $J$ quelconques 
(c), (c$'$), (c$''$) se voit
aisément en écrivant par exemple
$$
f^{-1}(]c,d[)=f^{-1}([-\infty,d[)\cap\complement f^{-1}([-\infty,c])
$$
pour tous $c<d$ dans $\ovl\bR$. Enfin l'équivalence avec (d) résulte du
fait que tout ouvert $U\subset\ovl\bR$ est réunion dénombrable d'intervalles
ouverts disjoints $Q_k$, de sorte que 
\hbox{$f^{-1}(U)=\bigcup f^{-1}(Q_k)$}.\qed
\medskip

Une conséquence immédiate de la définition est la suivante.
\medskip

{\bf (7.5) Proposition.} {\it Soit $f=(f_1,\ldots,f_m):P\to E$ une 
famille de fonctions mesu\-rables définies sur un pavé $P\subset\bR^n$,
à valeurs dans une partie $E\subset\bR^m$. Si $g:E\to\ovl\bR$ est une 
fonction continue, alors $G=g(f_1,\ldots,f_m)$ est mesurable.}

{\it Démonstration.} Si $U$ est un ouvert de $\ovl\bR$, alors $g^{-1}(U)$
est un ouvert de $E$, donc la trace $E\cap V$ d'un ouvert $V\subset\bR^m$.
On peut écrire $V$ comme une réunion dénombrable de pavés ouverts 
$Q_k=Q_k^1\times\ldots \times Q_k^m$ et on obtient ainsi
$$
G^{-1}(U)=\bigcup_k(f_1,\ldots,f_m)^{-1}(Q_k)=
\bigcup_k f_1^{-1}(Q_k^1)\cap\ldots\cap f_m^{-1}(Q_k^m).
$$
Ceci montre que $G$ est mesurable.\qed
\medskip

{\bf (7.6) Corollaire.} {\it Toute combinaison linéaire finie, tout 
produit de fonctions mesu\-rables à valeurs réelles est encore mesurable.
L'ensemble des fonctions mesurables $f:P\to\bR$ a donc une structure
d'algèbre.\qed}
\medskip

Par ailleurs, comme les ensembles négligeables
sont mesu\-rables, la mesurabilité n'est pas sensible au fait que la
fonction $f$ soit modifiée arbitrairement sur un ensemble  négligeable.
Un fait très utile est que la mesurabilité est préservée par passage 
à la limite dénombrable~:
\medskip

{\bf (7.7) Proposition.} {\it Soit $f_k:P\to\ovl\bR$ une suite de fonctions
mesurables. Alors $\limsup f_k$ et $\liminf f_k$ sont mesurables. Si
$(f_k)$ admet presque partout une limite $f$, alors $f$ est mesurable.}

{\it Démonstration.} Posons $f=\limsup f_k$. Nous avons alors par 
définition $f(x)<c$ si $\exists s>0$, $\exists N\ge 0$, $\forall k\ge N$,
$f_k(x)<c-1/s$, c'est-à-dire
$$
f^{-1}([-\infty,c[)=
\bigcup_{s>0}\bigcup_{N\ge 0}\bigcap_{k\ge N}f_k^{-1}([-\infty,c-1/s[),
$$
ce qui montre que $f$ est mesurable. La preuve pour $\liminf f_k$ se
déduit du cas de la $\limsup$ en remplaçant $(f_k)$ par $(-f_k)$.
Si $(f_k)$ admet une limite presque partout $f$, on conclut en écrivant
par exemple $f=\limsup f_k$ presque partout.
\qed
\medskip

{\bf (7.8) Proposition.} {\it Toute fonction $f:P\to\bR$ continue ou
HK-intégrable sur un pavé $P\subset\bR^n$ est mesurable.}

{\it Démonstration.} Il est clair que les fonctions continues sont
mesurables, puisque l'image inverse d'un intervalle ouvert est une
partie ouverte (donc mesurable) de $P$. Supposons maintenant $f$
HK-intégrable. Soit
$$
F(x_1,\ldots,x_n;y_1,\ldots,y_n)=\int_{x_1}^{y_1}\ldots\int_{x_n}^{y_n}
f(t_1,\ldots,t_n)\,dt_1\ldots dt_n
$$ 
l'«\?intégrale indéfinie\?» de $f$ sur~$P\times P$. 
On sait que $F$ est continue sur $P\times P$ d'après la proposition 1.15, 
et que (par exemple)
$$
f(x)=\lim_{h\to 0}{1\over h^n}F(x_1,\ldots,x_n;x_1+h,\ldots,x_n+h)
$$ 
pour presque tout $x\in P$ (théorème 6.4). En prenant $h=1/k\to 0$, 
on voit que $f$ est égale presque partout à une limite d'une suite de 
fonctions continues, par conséquent $f$ est mesurable.\qed
\medskip

{\bf (7.9) Proposition.} {\it Toute fonction mesurable $f:P\to\ovl\bR$ peut 
s'écrire $f=\lim f_k$ où les fonctions $f_k$ sont
des fonctions intégrables étagées, c'est-à-dire des combinaisons
linéaires finies $\sum\limits_{1\le \ell\le N_k}
c_{k,\ell}\chi_{E_{k,\ell}}$ de
fonctions caractéristiques d'ensembles inté\-gra\-bles.\\
Si de plus $f\ge 0$, on peut choisir la suite $(f_k)$ croissante et telle 
que $0\le f_k\le f$.}

{\it Démonstration.} Supposons d'abord $P$ fermé borné. On
prend alors
$$
\eqalign{
c_{k,\ell}&=(\ell-1)2^{-k}-k,\quad E_{k,\ell}=
f^{-1}([c_{k,\ell},c_{k,\ell}+2^{-k}[),\kern20.8pt
\hbox{si $\ell=1,2,\ldots,k\,2^{k+1}$},\cr
c_{k,\ell}&=k,\kern70.5pt E_{k,\ell}=f^{-1}([k,+\infty]),
\kern53pt\hbox{si $\ell=k\,2^{k+1}+1$},\cr 
c_{k,\ell}&=-k,\kern62pt E_{k,\ell}=f^{-1}([-\infty,-k[),
\kern46pt\hbox{si $\ell=p_n=k\,2^{k+1}+2$},\cr 
}
$$
de sorte que les ensembles $E_{k,\ell}$, $1\le \ell\le N_k$ forment une
partition mesurable de $P$. Il~est évident par construction que
la fonction $f_n=\sum c_{k,\ell}\chi_{E_{k,\ell}}$ vérifie 
$|f_k-f|\le 2^{-k}$ là où $|f(x)|<k$, tandis que $|f_k(x)|=k$ avec
le même signe que $f(x)$ là où $|f(x)|\ge k$. On a donc bien
$\lim f_k=f$. Lorsque $P$ est borné, les ensemble $E_{k,\ell}$ sont
intégrables et la proposition est démontrée. Si $P$ n'est pas borné,
il suffit de remplacer $E_{k,\ell}$ par $E'_{k,\ell}=E_{k,\ell}\cap[-k,k]^n$ 
pour conclure la démonstration. En effet, il est facile de constater que
$0\le f_k\le f$ et que la suite $(f_k)$ est croissante lorsque $f$ est 
elle-même positive ou nulle.\qed
\medskip

Le résultat suivant montre que la mesurabilité est la
propriété de régularité requise pour obtenir
l'intégrabilité, lorsqu'on a un encadrement par des fonctions
HK-intégrables.
\medskip

{\bf (7.10) Proposition.} {\it Soit $f,g,h:P\to\bR$ des fonctions telles que
$g\le f\le h$. On suppose que $g$ et $h$ sont HK-intégrables et que
$f$ est mesurable. Alors $f$ est HK-intégrable.}

{\it Démonstration.} Quitte à remplacer $f$ par $f-g$ et $h$ par $h-g$, 
on peut supposer $0\le f\le h$ avec $h$ HK-intégrable. La proposition
7.9 implique que $f=\lim f_k$ avec des fonctions $f_k$ étagées
HK-intégrables, que l'on peut choisir~$\ge 0$ d'après la
démonstration. Toutes ces fonctions
sont donc absolument intégrables, et on peut écrire $f=\lim_{k\to+\infty}
\min(f_k,h)$. On voit donc que $f$ est HK-intégrable comme limite
dominée de fonctions HK-intégrables.\qed
\medskip

{\bf (7.11) Espace {\bfit L}${}^\infty$({\bfit P}$\,$).} Soit $f:P\to\bR$
(ou même plus généralement $f:P\to\ovl\bR$)
une fonction mesurable. On définit le sup essentiel de $f$
par
$$
\eqalign{
\supess_{x\in P} f(x)
&=\min\big\{M\in[-\infty,+\infty]\,;\;f(x)\le M~~
\hbox{presque partout sur $P$}\big\}\cr
&=\min\big\{M\in[-\infty,+\infty]\,;\;f^{-1}(]M,+\infty])~
\hbox{est négligeable}\big\}.\cr}
$$
Il s'agit bien d'un minimum du fait que si $M$ est la limite d'une
suite $M_k$ strictement décroissante pour laquelle $f^{-1}(]M_k,+\infty])$
est négligeable, alors $f^{-1}(]M,+\infty])=\bigcup f^{-1}(]M_k,+\infty])$
est encore négligeable. De même, on définit l'inf essentiel de $f$ par
$$
\infess_{x\in P} f(x)
=\max\big\{\mu\in[-\infty,+\infty]\,;\;f^{-1}([-\infty,\mu[)~
\hbox{est négligeable}\big\}.
$$
On définit la norme $L^\infty$ de $f$ par
$$
\Vert f\Vert_\infty=\max\big(\supess_{x\in P} f(x),\supess_{x\in P}(-f(x))
\big),
$$
de sorte que $|f(x)|\le M=\Vert f\Vert_\infty$ presque partout, $M$
étant le plus petit majorant pour lequel ceci ait lieu. 

Enfin, on définit l'espace $\tilde L^\infty(P)$ des fonctions dites
{\it essentiellement bornées} comme l'ensemble des fonctions 
$f:P\to\bR$ de norme $\Vert f\Vert_\infty$ finie, et $L^\infty(P)=
\tilde L^\infty(P)/N(P)$ comme le quotient de $\tilde L^\infty(P)$ 
par l'espace des fonctions négligeables $N(P)$ -- lequel
est précisément donné par $N(P)=\{f\in\tilde L^\infty(P)\,;\;
\Vert f\Vert_\infty=0\}$.

Il~est clair que si $f\in L^\infty(P)$, on peut choisir un représentant
de la fonction $f$ tel qu'on ait $|f(x)|\le\Vert f\Vert_\infty$ {\it partout}, 
et pas seulement presque partout $\big[$quitte à redéfinir
$f(x)=0$ sur l'ensemble négligeable dans lequel $|f(x)|>\Vert
f\Vert_\infty\big]$. On voit alors que toute série normalement convergente
dans $L^\infty(P)$ est convergente, de sorte que $L^\infty(P)$ est encore
un espace de Banach.

\medskip

{\bf (7.12) Inégalité de Hölder pour $L^1$ et $L^\infty\;$:}
pour tout couple de fonctions $f\in L^1(P)$ et $g\in L^\infty(P)$, on a
$$
\Big|\int_Pf(x)g(x)\,dx\Big|\le\Vert f\Vert_1\Vert g\Vert_\infty.
$$
En effet, ceci résulte du fait que
$|f(x)g(x)|\le \Vert g\Vert_\infty |f(x)|$ presque partout sur~$P$.\qed
\medskip

Le résultat suivant montre que les fonctions intégrables au sens de
Henstock-Kurzweil doivent tout de même être absolument intégrables sur
des ensembles assez gros, bien qu'il puisse subsister des endroits
où on a affaire à une intégrale oscillante non absolument convergente.
La démonstration exploite la mesurabilité.
\medskip

{\bf (7.13) Théorème.} {\it Soit $P$ un pavé fermé borné et $f:P\to\bR$
une fonction intégrable au sens de Henstock-Kurzweil sur~$P$. Alors
{\parindent=6.5mm
\item{\rm (a)} Il existe une suite croissante de
parties fermées $K_s\subset P$ telle que $\bigcup K_s=P$ et
$$
\int_{K_s}|f(x)|\,dx=\int_P\chi_{K_s}(x)\,|f(x)|\,dx<+\infty.
$$
En particulier, la mesure $m(P\ssm K_s)$ peut être prise arbitrairement 
petite.
\item{\rm(b)} L'ensemble $U\subset P$ des points $x_0$ pour lesquels
il existe un pavé ouvert $Q$ de centre $x_0$ sur lequel
$\int_Q|f(x)|\,dx<+\infty$ est un ouvert dense dans $P$.\medskip}}

{\it Démonstration.} (a) Fixons $\varepsilon_0>0$ et une jauge $\delta_0$
$\varepsilon_0$-adaptée à~$f$. On pose
$$
E_s=\big\{x\in P\,;\;|f(x)|\le s~\hbox{et}~\delta_0(x)\ge 1/s\big\}\quad
\hbox{et}\quad K_s=\ovl E_s,\quad s\in\bN^*.
$$
Il est clair que $E_s\subset K_s$ sont des suites
croissantes d'ensembles et que $\bigcup E_s=P$ (du fait que
$f$ est partout finie et $\delta_0$ partout${}>0$); on a donc aussi
$\bigcup K_s=P$. D'après le lemme de Henstock 1.1~(b), nous obtenons
$$
\sum_{0\le j<N}\bigg|f(x_j)\vol(Q_j)-\int_{Q_j}f(x)\,dx\bigg|\le 
2\varepsilon_0\leqno(7.14)
$$
pour toute subdivision pointée $D= \{(Q_j,x_j)\}_{0\le j<N}$ $\delta_0$-fine
(complète ou partielle) de $P$. Soit $A$ un réel positif assez
grand et $\varepsilon>0$ arbitrairement petit. La fonction 
$g(x)=\chi_{K_s}(x)\min(|f(x)|,A)$ est mesurable bornée, donc HK-intégrable,
ce qui implique
$$
\leqalignno{
\int_P\chi_{K_s}(x)\min(|f(x)|,A)\,dx&=\int_P g(x)\,dx
=\limsup_{D,\,\HK}S_D(g)\cr
&=\inf_{\delta}\sup_{D\;\delta\hbox{\sevenrm -fine}}
\sum_{0\le j<N}\chi_{K_s}(x_i)\min(|f(x_i)|,A)\vol(Q_j)\cr
&\le\inf_{\delta}\sup_{D\;\delta\hbox{\sevenrm -fine}}
\sum_{j,\,x_j\in K_s}|f(x_i)|\vol(Q_j)\cr
&\le\sup_{D\;\delta_\varepsilon\hbox{\sevenrm -fine}}
\sum_{j,\,x_j\in K_s} \bigg|\int_{Q_j}f(x)\,dx\bigg|+2\varepsilon
&(7.15)\cr}
$$
où $\delta_\varepsilon$ désigne une jauge $\varepsilon$-adaptée à $f$ (pour 
cette dernière inégalité, on applique bien sûr encore le lemme de Henstock
1.1~(b)); on suppose de plus $\delta_\varepsilon$ choisie en sorte
que $\delta_\varepsilon(x)<1/s$ en tout point. Soit
$D=\{(Q_j,x_j)\}_{0\le j<N}$ une subdivision $\delta_\varepsilon$-fine
arbitraire. On pose $Q_j=\prod_{1\le k\le n}[a_{j,k},b_{j,k}]$,
$x_j=(x_{j,1},\ldots,x_{j,n})$, et on note $J$ l'ensemble des
indices $j=0,1,2,\ldots,N-1$ tels que $x_j\in K_s$. Enfin, on associe
à chaque indice $j\in J$ l'élément $\alpha_j\in\{-1,0,+1\}^n$ tel que
$$
\alpha_{j,k}=\cases{
-1&si $x_{j,k}=a_{j,k}$,\cr
0&si $x_{j,k}\in{}]a_{j,k},b_{j,k}[$,\cr
+1&si $x_{j,k}=b_{j,k}$.\cr}
$$
Ceci fournit une partition $J=\bigcup J_\alpha$ en $3^n$ parties
$J_\alpha=\{j\in J\,;\;\alpha_j=\alpha\}$. Fixons $\eta>0$ assez petit. 
Pour $j\in J$, on a par définition $x_j\in K_s=\ovl{E_s}$, donc
on peut trouver un
point $x'_j\in E_s$ tel que $d(x_j,x'_j)\le\eta$. On définit d'autre part
$$
Q'_j=\prod_{1\le k\le n}[a'_{j,k},b'_{j,k}]
$$
avec
$$
a'_{j,k}=\cases{
x'_{j,k}&si $x_{j,k}=a_{j,k}$,\cr
a_{j,k}+\eta&sinon,\cr}\qquad
b'_{j,k}=\cases{
x'_{j,k}&si $x_{j,k}=b_{j,k}$,\cr
b_{j,k}-\eta&sinon,\cr}
$$
et on suppose de plus qu'on a pris $\eta$ plus petit que la moitié
${1\over 2}\min(x_{j,k}-a_{j,k},b_{j,k}-x_{j,k})$ du
minimum des différences non nulles $x_{j,k}-a_{j,k}$ et $b_{j,k}-x_{j,k}$,
et aussi plus petit que la moitié des distances des cubes $Q_j$, $Q_\ell$
non adjacents.
Dans ces conditions, il est clair que $x'_j\in Q'_j$ et que les
pavés $Q'_j$ correspondant aux  indices $j\in J_\alpha$ sont
d'intérieurs disjoints pour chaque $\alpha\in\{-1,0,+1\}^n$ fixé$\,$; en
effet, il ne pourrait y avoir une intersection d'intérieur non vide que
pour deux indices distincts $j,\ell\in J_\alpha$ tels que 
$Q_j$ et $Q_\ell$ étaient adjacents relativement à une face $x_k={}$Cte,
pour laquelle on a par exemple
$a'_{j,k}=x'_{j,k}$ et $b'_{\ell,k}=x'_{\ell,k}$ avec 
$x_{j,k}=a_{j,k}=x_{\ell,k}=b_{\ell,k}$, mais ceci est exclu puisqu'alors
$-1=\alpha_{j,k}\ne\alpha_{\ell,k}=+1$. D'autre part, pour $\eta$ assez 
petit, le théorème 1.3~(b) implique
$$
\bigg|\int_{Q'_j}f(x)\,dx-\int_{Q_j}f(x)\,dx\bigg|\le \varepsilon/N,
\leqno(7.16)
$$
et comme $\diam Q_j\le \delta_\varepsilon(x_j)<1/s$, on pourra aussi
obtenir que $\diam Q'_j<1/s\le\delta_0(x'_j)$ du fait que $x'_j\in E_s$.
Ceci montre que $\{(Q'_j,x'_j)\}_{j\in J_\alpha}$
est une subdivision partielle \hbox{$\delta_0$-fine} de~$P$. 
D'après (7.14) on en déduit
$$
\sum_{j\in J_\alpha} \bigg|\int_{Q'_j}f(x)\,dx\bigg|
\le
\sum_{j\in J_\alpha} |f(x'_j)|\vol(Q'_j)+2\varepsilon_0
\le s\vol(P)+2\varepsilon_0,
$$
puisque $x'_j\in E_s$ implique $|f(x'_j)|\le s$. En prenant la somme sur
$\alpha\in\{-1,0,+1\}^n$, il vient d'après (7.16)
$$
\sum_{j\in J} \bigg|\int_{Q_j}f(x)\,dx\bigg|\le
3^n\big(s\vol(P)+2\varepsilon_0\big)+N\varepsilon/N,
$$
et en combinant ceci avec (7.15) après être passé au sup sur toutes les
subdivisions $D$ $\delta_\varepsilon$-fines on trouve
$$
\int_P\chi_{K_s}(x)\min(|f(x)|,A)\,dx\le 
3^n\big(s\vol(P)+2\varepsilon_0\big)+3\varepsilon.
$$
On ternine en appliquant le théorème de convergence monotone avec
$A\to+\infty$. Comme $\varepsilon$ peut être pris arbitrairement petit
ceci donne
$$
\int_P\chi_{K_s}(x)|f(x)|\,dx\le 
3^n\big(s\vol(P)+2\varepsilon_0\big)<+\infty.
$$
Comme $\bigcup K_s=P$, on voit de plus que $\lim m(P\ssm K_s)=0$.

(b) Il est clair par définition que $U$ est ouvert.
Pour tout pavé fermé borné $P'\subset P$ d'intérieur non vide, le théorème
de Baire appliqué à $P'=\bigcup P'\cap K_s$ montre que l'une des
parties $P'\cap K_s$ est d'intérieur non vide dans $P'$, 
donc $P'\cap U\ne \emptyset$.
Ceci entraîne que $U$ est un ouvert dense dans~$P$.\qed
\medskip

On va voir, déjà dans le cas des fonctions d'une seule variable, 
que l'ouvert $U$ du théorème~7.13~(b) peut être de mesure 
arbitrairement petite dans $P$. L'exemple suivant est dû 
à Jitan Lu et Peng Yee Lee [LL].
\medskip

{\bf (7.17) Exemple.} Soit $f_{a,b}:\bR\to\bR$ la fonction telle que
$$
\cases{
f_{a,b}(x)=0
&si $x\in\bR\ssm{}]a,b[$,\cr
f_{a,b}(x)=\displaystyle(x-a)^2(x-b)^2\sin{1\over (x-a)^2(x-b)^2}
&si $x\in{}]a,b[$.\cr}
$$
Il est facile de constater que $f_{a,b}$ est partout dérivable sur
$\bR$, mais que $f'_{a,b}$ n'est pas absolument intégrable au voisinage
des points $a$ ou $b$~: le comportement est le même que celui de la
fonction $x\mapsto x^2\sin(1/x^2)$ en $0$, dont la dérivée
$2x\sin(1/x^2)-(2/x)\cos(1/x^2)$ n'est pas absolument intégrable.
On considère maintenant
un ensemble de Cantor $K\subset [0,1]$ de mesure $\prod_{k\ge 1}
(1-\varepsilon_k)$ en pratiquant des divisions itératives de $[0,1]$
en trois intervalles de proportions respectives $(1-\varepsilon_k)/2$,
$\varepsilon_k$, $(1-\varepsilon_k)/2$ et en omettant chaque fois
l'intervalle central. On suppose ici $\sum\varepsilon_k\le \varepsilon$,
de sorte que $m(K)\ge 1-\varepsilon$. Le complémentaire $[0,1]\ssm K$ est 
formé d'une réunion dénombrable d'intervalles ouverts $]a_j,b_j[$. On pose
$f(x)=0$ sur $K$ et $f(x)=f_{a_j,b_j}(x)$ sur $]a_j,b_j[$. Il est facile
de voir que $f$ est partout dérivable sur $[0,1]$ avec une dérivée
nulle sur~$K$. En effet, la dérivabilité est évidente sur chaque
intervalle $]a_j,b_j[$. Montrons que $f'(x_0)=0$ en tout point 
$x_0\in K$. Si $x\in{}]a_j,b_j[$
avec par exemple $a_j\ge x_0$, on a 
$$|f(x)|\le (b_j-a_j)^2(x-a_j)^2\le (x-a_j)^2\qquad\hbox{tandis
que $x-x_0\ge x-a_j$},
$$
d'où $|f(x)/(x-x_0)|\le |x-a_j|\le|x-x_0|$. Le raisonnement est le même si
$x\in{}]a_j,b_j[$ avec $b_j\le x_0$, et si $x\in K$ on a $f(x)=0$
par définition. 
En particulier $f'$ est intégrable au sens de Henstock sur $[0,1]$, mais
ne peut être intégrable au sens de Lebesgue  au voisinage
d'aucun point de $K$ car les points $a_j,b_j$ s'y accumulent.
\bigskip

\section{8. Densité des fonctions continues à support compact}

Si $A\subset\bR^n$ est une partie mesurable quelconque, on définit
l'intégrale $\int_A f(x)\,dx$ d'une fonction $f:A\subset\bR$ en
considérant tout simplement l'intégrale $\smash{\int_{\bR^n}\tilde
f(x)\,dx}$ du prolongement $\tilde f$ de $f$ à $\bR^n$ tel que $\tilde
f(x)=0$ sur $\bR^n\ssm A$. Ceci permet de parler de
l'intégrabilité ou de la mesurabilité de $f\,$; on obtient
ainsi un espace de Banach $L^1(A)$ en adaptant les résultats des
sections 4 et 5 au cas des fonctions sur le pavé infini~$P=\bR^n$, 
nulles sur~$\bR^n\ssm A$.

Nous démontrons maintenant un résultat très important,
à savoir la densité des fonctions continues à support compact 
dans l'espace de Banach $L^1(\Omega)$ pour tout ouvert
$\Omega$ de~$\bR^n$.%
\note{20}{Incidemment 
ce résultat (et plus spécifiquement 8.1 (d) ci-après) démontre que les
fonctions absolument intégrables au sens de Henstock-Kurzweil sont 
exactement
les fonctions intégrables au sens de Lebesgue pour la mesure de
Lebesgue usuelle. Jusqu'à ce point, il était évident que
l'espace $\smash{L^1(P)}$ de Henstock-Kurzweil contenait celui de Lebesgue,
mais il n'était pas clair qu'il ne soit pas plus gros. Les deux théories 
se rejoignent donc dans le cas des fonctions absolument intégrables.}
\medskip

{\bf (8.1) Densité des fonctions continues à support compact.} {\it 
{\parindent=6.5mm
\item{\rm(a)} Soit $E\subset\bR^n$ un ensemble mesurable. Pour tout
$\varepsilon>0$, il existe une application continue $g:\bR^n\to [0,1]$ telle 
que $g(x)=\chi_E(x)$ hors d'un ensemble ouvert $V$ de mesure 
$m(V)\le\varepsilon$.
\item{\rm(b)} Soit $f:\Omega\to\ovl\bR$ une fonction mesurable sur un
ouvert $\Omega\subset\bR^n$. Il existe
une suite $g_k:P\to\bR$ d'applications continues à support compact
dans $\Omega$ telles que $g_k\to f$ presque partout.
\item{\rm(c)} Soit $f\in L^1(\Omega)$. Il existe une suite $g_k:\Omega\to\bR$
d'applications continues à support compact dans $\Omega$
telles que $g_k\to f$ presque partout et $\Vert g_k-f\Vert_1\to 0$.
\item{\rm(d)} L'espace $\cC_c(\Omega)$ des fonctions continues à support
compact dans $\Omega$ est dense dans $L^1(\Omega)$, et $L^1(\Omega)$ s'identifie au
complété de $\cC_c(\Omega)$ pour la norme~$\Vert~~\Vert_1$.\vskip0pt
}}

{\it Démonstration.} (a) Grâce à 7.4, choisissons $F$ un ensemble 
fermé et $U$ un ensemble ouvert tels que $F\subset
E\subset U$ et $m(U\ssm F)\le\varepsilon$. On pose
$$
g(x)={d(x,\complement U)\over d(x,F)+d(x,\complement U)}.
$$ Il est clair que $0\le g(x)\le 1$ et que $g$ est continue (le
dénominateur ne s'annule pas puisque $F$ et $\complement
U$ sont des fermés disjoints). De plus $g(x)=1$ si $x\in F$ et $g(x)=0$ si
$x\in\complement U$, donc $g$ répond à la question en posant
$V=U\ssm F$.

(b) et (c). On se ramène d'abord au cas où $f\ge 0\;$: si le résultat
est démontré dans ce cas, on écrit $f=f_+-f_-$ et
$$
f_+=\lim g'_k,\qquad
f_-=\lim g''_k,\qquad
f=\lim g'_k-g''_k\qquad\hbox{presque partout}
$$
avec $g'_k$ et $g''_k$ continues à support compact. On supposera
donc dans la suite que $f\ge 0$. 
Dans ce cas, la proposition 7.9 fournit une suite croissante de
fonctions étagées $f_k=\sum_{1\le \ell\le N_k}c_{k,\ell}\chi_{E_{k,\ell}}$
telles que $f=\lim f_k$ en tout point. Quitte à perdre
éventuellement la convergence sur le bord $\partial \Omega$ (négligeable), 
on peut supposer que $E_{k,\ell}\subset \Omega_k$ pour une certaine suite 
strictement croissante d'ouverts relativement compacts 
$\Omega_k\subset \Omega$ tels que $\Omega=\bigcup \Omega_k$ 
(sinon on remplace tout simplement $E_{k,\ell}$ par
$E_{k,\ell}\cap \Omega_k$). D'après (a) [avec $U\subset\Omega_k$, on 
peut trouver 
une fonction continue $g_{k,\ell}:\Omega\to\bR$ telle que $g_{k,\ell}=
\chi_{E_{k,\ell}}$
hors d'un ensemble ouvert $V_{k,\ell}$ de mesure${}\le 2^{-k}/N_k$ et 
à support dans $\ovl\Omega_k$. Par suite
$g_k=\sum_{1\le\ell\le N_k}c_{k,\ell}g_{k,\ell}$ est continue 
à support compact dans $\ovl\Omega_k\subset \Omega$ et coïncide 
avec $f_k$ hors de
$V_k=\bigcup_\ell V_{k,\ell}$, $m(V_k)\le 2^{-k}$. En dehors de 
$W_s=\bigcup_{k>s}V_k$
qui est de mesure${}\le 2^{-s}$, il est clair que $g_k\to f$ puisque
$g_k=f_k$ pour $k>s$, et par conséquent $g_k\to f$ hors de
l'ensemble négligeable $N=\bigcap_s W_s$. Ceci démontre (b). 
Si en outre $f$ est intégrable, alors le théorème de convergence
dominée appliqué à la suite décroissante $f-f_k\to 0$
dominée par $f$ montre que $\lim\Vert f_k-f\Vert_1=0$. En prenant 
de plus $m(V_{k,\ell})\le 2^{-k}/(1+N_k|c_{k,\ell}|)$, il vient $\Vert
g_{k,\ell}-\chi_{E_{k,\ell}}\Vert_1\le 2^{-k}/(1+N_k|c_{k,\ell}|)$, donc 
$\Vert g_k-f_k\Vert_1\le 2^{-k}$ et (c) s'ensuit.

(d) résulte de (c), puisque nous savons que $L^1(\Omega)$ est complet, et
de plus $\cC_c(\Omega)$ s'identifie à un sous-espace de 
$L^1(\Omega)$ d'après 2.8~(a) (ou, du moins, son analogue en plusieurs 
variables, qui se démontre de la même manière).\qed
\medskip

Une première conséquence du théorème de densité des
fonctions continues est la carac\-térisation suivante des fonctions
mesurables.
\medskip

{\bf (8.2) Caractérisation des fonctions mesurables
(théorème de Lusin).}\\
{\it Soit $A\subset\bR^n$ une partie mesurable et
$f:A\to\ovl\bR$ une fonction quelconque. Il y a équivalence entre$\;:$
{\parindent=6.5mm
\item{\rm(a)} $f$ est mesurable.
\item{\rm(b)} Pour tout $\varepsilon>0$, il existe une partie ouverte
$V\subset \bR^n$ de mesure $m(V)\le\varepsilon$ telle que la
restriction $f_{|A\ssm V}$ soit continue.\vskip0pt
}
}

{\it Démonstration.} Commençons par le sens «\?facile\?».

(b)${}\Rightarrow{}$(a). Pour $k$ entier${}>0$, fixons un ouvert $V_k$
tel que $m(V_k)\le 2^{-k}$ et $f_{|A\ssm V_k}$ continue. Quitte à
remplacer $V_k$ par $V'_k=\bigcup_{\ell>k}V_\ell$, on peut supposer que la
suite $V_k$ est décroissante. Posons alors $f_k(x)=0$ si
$x\in V_k$ et $f_k(x)=f(x)$ si $x\in A\ssm V_k$. Soit $U$ un ouvert
de $\ovl\bR$. Alors
$$
\eqalign{
f_k^{-1}(U)&=f^{-1}(U)\cap(A\ssm V_k)\kern50pt\hbox{si $0\notin U$},\cr
f_k^{-1}(U)&=V_k\cup\big(f^{-1}(U)\cap(A\ssm V_k)\big)\qquad\hbox{si $0\in U$}.
\cr}
$$
Dans les deux cas $f_k^{-1}(U)$ est mesurable puisque 
$f^{-1}(U)\cap(A\ssm V_k)$
est une partie ouverte de $A\ssm V_k$ (et donc l'intersection d'un ouvert
avec la partie mesurable $A\ssm V_k$). Ceci prouve que $f_k$ est mesurable.
Comme $f=\lim f_k$ hors de la partie négligeable $N=\bigcap V_k$, on
voit que $f$ est elle aussi mesurable.

(a)${}\Rightarrow{}$(b). Quitte à étendre $f$ par $0$ sur $\bR^n\ssm A$, on
peut supposer $A=\bR^n$. D'après 8.1~(b), il existe une suite
d'applications continues \hbox{$g_k:\bR^n\to\bR$} telles que $g_k\to f$
presque partout. Comme $\ovl\bR$ est homéomorphe à $[-1,1]$ par
l'appli\-cation $x\mapsto x/(1+|x|)$, on peut tout aussi bien supposer
que $f$ et les $g_k$ sont à valeurs dans $[-1,1]$. Soit $N\subset \bR^n$
un ensemble négligeable tel que $g_k(x)$ converge vers $f(x)$ pour
tout $x\in \bR^n\ssm N$. Soit $(P_s)_{s\ge 0}$ une suite croissante 
de pavés fermés bornés tels que $\bigcup P_s=\bR^n$. Pour chaque paire
d'entiers $r$, $s$, considérons
$$
U_{r,s}=\big\{x\in P_s\,;\;\exists k,\ell\ge r,\;|g_k(x)-g_\ell(x)|>2^{-s}
\big\}.
$$
C'est une partie ouverte de $P_s$, de plus la suite
$(U_{r,s})_{r\ge 0}$ est décroissante et\break 
$\bigcap_{r\ge 0}U_{r,s}\subset N$
d'après le critère de Cauchy. Comme $N$ est négligeable, nous avons 
$\lim_{r\to+\infty}m(U_{r,s})\le m(N)=0$,
donc il existe un indice $r(s)$ tel que $m(U_{r(s),s})\le 2^{-s}$. Il n'est
pas restrictif de supposer que l'on choisit $r(s+1)>r(s)$ pour tout~$s$.
Soit $V_q$ une partie ouverte de $P$ contenant 
$N\cup\bigcup_{s\ge q}U_{r(s),s}$,
telle que $m(V_q)\le 2^{2-q}$. Pour $k\ge s\ge q$ et $x\in P_q\ssm V_q\subset
P_s\ssm U_{r(s),s}$, 
nous avons $|g_{r(s)}(x)-g_{r(s+1)}(x)|\le 2^{-s}$. Ceci
entraîne que $f$ est la limite uniforme des $g_{r(s)}$ sur toute partie
compacte de $\bR^n\ssm V_q$, donc $f_{|\bR^n\ssm V_q}$ est continue.\qed
\medskip

Nous utilisons maintenant la densité des fonctions continues pour étendre
les théorèmes fondamentaux déjà démontrés dans ce cadre. Pour cela, on utilise
le fait que toute fonction $f\in L^1(\Omega)$ absolument intégrable sur
un ouvert $\Omega\subset\bR^n$ est limite en norme $L^1$ d'une suite
de fonctions continues à support compact $(g_k)$ telles que (disons)
\hbox{$\Vert g_k-g_{k-1}\Vert_1\le 2^{-k}$}. On peut donc représenter $f$ comme
somme d'une série $L^1$ con\-vergente $f=\sum u_k$ de fonctions continues
à support compact, avec $u_0=g_0$ et\break $u_k=g_k-g_{k-1}$. Enfin,
on peut écrire 
$$
f=f'-f''~~\hbox{avec}~~f'=\sum_k u_k^+,~~f''=\sum_k u_k^-,~~
\Vert u_k^+\Vert_1+\Vert u_k^-\Vert_1\le 2^{-k}~~\hbox{si $k\ge 1$},
\leqno(8.3)
$$
de sorte que $f$ apparaît comme une différence de limites croissantes
$L^1$ convergentes de fonctions positives continues à support compact.
L'égalité (8.3) est vraie seulement presque partout.
\medskip

{\bf (8.4) Formule du changement de variable dans $\bR^n$.} {\it 
Soit $\varphi:\Omega\to\Omega'$ une bijection de classe 
$C^1$ entre deux ouverts de $\bR^n$, telle que le déterminant jacobien
$$
\Jac\varphi(x)=\det\left({\partial\varphi_i\over\partial x_j}
\right)_{1\le i,j\le n}
$$
soit partout non nul. Alors pour toute fonction
$f:\varphi(\Omega)=\Omega'\to\bR$ dans $L^1(\Omega')$ on a
$$
\boxed{16}{
\int_{\varphi(\Omega)}f(y)\,dy=\int_{\Omega}f(\varphi(x))\,|\Jac\varphi(x)|\,dx
}
$$
et l'intégrale du membre de droite est elle aussi absolument convergente
sur $\Omega$.}

{\it Démonstration.} La première chose à voir ($f$ étant
peut-être seulement définie presque partout) est que l'image
inverse $\varphi^{-1}(N)$ d'un ensemble négligeable dans $\Omega'$
est négli\-geable dans $\Omega$. Or ceci résulte du lemme suivant et
du fait que le
difféomorphisme $\varphi$ est une application localement
lipschitzienne ainsi que son inverse $\varphi^{-1}$.
\medskip

{\bf (8.5) Lemme.} {\it Soit $\psi:\Omega'\to\Omega$ une application
localement lipschitzienne dans $\Omega'$. Alors l'image $\psi(N)$ de tout
ensemble négligeable $N$ de $\Omega'$ est négligeable dans $\Omega$.}

En effet, quitte à écrire $\psi(N)=\bigcup\psi(N\cap K_j)$ pour une
certaine suite croissante de parties compactes $K_j\subset\Omega'$, on
peut supposer $N\subset K$ compact${}\subset\Omega'$ et $\psi$
lipschitzienne de rapport $k$. Pour tout $\varepsilon$, on peut alors
recouvrir $N$ par une famille dénombrable de cubes $Q_\alpha$ de diamètre
$d_\alpha$, tels que $\sum\vol(Q_\alpha)=\sum d_\alpha^n\le\varepsilon$.
Comme $\psi(Q_\alpha)$ est contenu dans un cube $Q'_\alpha$ de diamètre
$d'_\alpha\le kd_\alpha$, on en déduit que $m(\psi(N))\le k^n\varepsilon$
pour tout~$\varepsilon>0$, ce qui montre que $\psi(N)$ est négligeable.\qed

Pour terminer la démonstration, on utilise maintenant (8.3) et le
fait que la formule est vraie pour $u_k^+$ et $u_k^-$ d'après le
théorème 3.6.  On en déduit que la formule est vraie pour $f'$
et $f''$ par le théorème de convergence monotone, puis qu'elle est
vraie pour $f$ par différence.\note{21}{On observera que si les
résultats démontrés au chapitre II avaient été traités
{\it après la preuve des théorèmes fondamentaux de convergence},
on aurait pu en simplifier notablement la démons\-tration~: en
effet, comme on vient de le voir, le résultat local valable a priori
pour les fonctions continues à support compact dans l'image d'un
petit pavé $\smash{{\textfont1=\eightplrm\Omega}'_P=
\varphi(P^\circ)}$ s'étend aux fonctions
$\smash{f\in L^1({\eightplrm\Omega}'_P)}$ quelconques, et de là 
à un ouvert quelconque en prenant une partition dénombrable 
de $\eightplrm\Omega$ par des~pavés.
L'argument de partition continue de l'unité devient
inutile, de même que le préambule destiné à introduire ce
qu'est l'intégrale sur un ouvert -- sachant que la fonction
caractéristique d'un ouvert est une fonction mesurable.}\qed
\medskip

\vbox{%
{\bf (8.6) Théorème de Fubini.} {\it Soient $A\subset\bR^n$ et
$B\subset\bR^m$ des parties mesurables et $f:A\times B\to \bR$ 
une fonction absolument intégrable. Alors, en notant 
$$
(x,y)=(x_1,\ldots,x_n\,;\,y_1,\ldots,y_m)\in\bR^n\times\bR^m
$$
les variables dans $A\times B$, on a
$$
\boxed{16}{
\int_{A\times B}f(x,y)\,dx\,dy
=\int_A\Big(\int_B f(x,y)\,dy\Big)dx.}
$$
Ceci signifie implicitement~:
{\parindent=6.5mm
\item{\rm(a)} que pour presque tout $x\in A$, la fonction
$y\mapsto f(x,y)$ est dans $L^1(B)$.
\item{\rm(b)} que la fonction presque partout définie
$x\mapsto \int_{y\in B}f(x,y)\,dy$ est dans $L^1(A)$.
\vskip0pt}
$[$et on peut bien entendu échanger les rôles de $A$ et $B$ dans ce qui
précède$\,]$.
}}
\medskip

{\it Démonstration.} Quitte à étendre $f$ par $0$ hors de $A\times B$, on
peut supposer que $A=\bR^n$ et $B=\bR^m$. 

(1) On commence par démontrer le
résultat lorsque $f=\lim g_k$ est la limite d'une suite croissante
de fonctions continues $g_k\ge 0$ à support compact dans
$\bR^n\times\bR^m$. Comme le résultat
est vrai pour les $g_k$ d'après le théorème 1.12, les fonctions
$$
G_k(x)=\int_{y\in\bR^m}g_k(x,y)\,dy
$$
fournissent une suite croissante de fonctions continues à 
support compact dans $\bR^n$ telles que 
$$
\int_{\bR^n}G_k(x)\,dx=
\int_{\bR^n\times\bR^m}g_k(x,y)\,dx\,dy\le
\int_{\bR^n\times\bR^m}f(x,y)\,dx\,dy<+\infty.
$$
D'après le théorème de convergence monotone 4.5, on voit que
$$
F(x):=\lim_{k\to +\infty}G_k(x)=\lim_{k\to +\infty}
\int_{\bR^m}g_k(x,y)\,dy=\int_{\bR^m}f(x,y)\,dy
$$
est finie presque partout, puisque
$$
\eqalign{
\int_{\bR^n} F(x)\,dx=\lim_{k\to +\infty}\int_{\bR^n}G_k(x)\,dx
&=\lim_{k\to +\infty}\int_{\bR^n\times\bR^m}g_k(x,y)\,dx\,dy\cr
&=\int_{\bR^n\times\bR^m}f(x,y)\,dx\,dy<+\infty.\cr}
$$
Ceci démontre à la fois l'égalité cherchée et les observations
complémentaires (a) et~(b).

(2) Il résulte de (1) que la formule est vraie si $f=\chi_U$ est la
fonction caractéristique d'un ouvert intégrable, puisqu'une telle
fonction est la limite d'une suite croissante de fonctions continues
à support compact dans $U$. Plus généralement, la formule est
vraie si $f=\chi_A$ où $A=\bigcap U_k$ est l'intersection d'une
suite décroissante d'ouverts intégrables (c'est-à-dire un
$G_\delta$ intégrable)~: il suffit pour cela d'appliquer le
théorème de convergence monotone à la suite décroissante
$\chi_{U_k}$.

(3) Si $f=\chi_E$ est la fonctions caractéristique d'un ensemble
négligeable, les tranches $E\cap(\{x\}\times\bR^m)$ sont
négligeables pour presque $x\in\bR$ et la formule est vraie (avec
des intégrales presque toutes égales à $0$). Pour le voir, on 
utilise (2) et 7.3 (a),
qui implique l'existence d'un $G_\delta$ négligeable $G$ tel que
$E\subset G$.

(4) Comme conséquence de (3), le fait que $f$ soit modifiée sur un
ensemble négligeable de $\bR^n\times\bR^m$ ne change rien, puisque
les intégrales $\int_{\bR^m}f(x,y)\,dy$ ne sont alors modifiées
que sur une partie négligable de valeurs de $x\in\bR^n$. On peut
donc supposer $f$ seulement définie presque partout dans
$\bR^n\times\bR^m$.  Cette dernière observation, combinée à
(8.3) et à la partie (1) conclut la démonstration.\qed
\medskip

{\bf (8.7) Théorème de Tonelli.} {\it Soient $A\subset\bR^n$ et
$B\subset\bR^m$ des parties mesurables et $f:A\times B\to \bR$ 
une fonction mesurable. On suppose que
{\parindent=6.5mm
\item{\rm(a)} pour presque tout $x\in A$, la fonction
$y\mapsto |f(x,y)|$ est intégrable sur $B\;;$
\item{\rm(b)} l'intégrale itérée
$\int_A\big(\int_B|f(x,y)|\,dy\big)dx$ est convergente.
\vskip0pt}
Alors $f$ est dans $L^1(A\times B)$ et on a 
$$
\boxed{16}{
\int_{A\times B}f(x,y)\,dx\,dy
=\int_A\Big(\int_B f(x,y)\,dy\Big)dx.}
$$}

{\it Démonstration.} Quitte à écrire $f=f_+-f_-$ où $f_+=\max(f,0)$,
$f_-=\max(-f,0)$, on voit que $f_+$ et $f_-$ sont mesurables d'après
la proposition 7.5 et on se ramène immédiatement au cas où $f\ge 0$.

On écrit maintenant $f=\lim f_k$ comme limite croissante des
fonctions $f_k\ge 0$ telles que
$$
f_k(x,y)=\min\big(f(x,y),k\,\chi_{[-k,k]^{n+m}}(x,y)\big).
$$
Ces fonctions sont intégrables sur $A\times B$ puisque la fonction
caractéristique $\chi_{[-k,k]^{n+m}}$ du pavé $[-k,k]^{n+m}$
l'est sur $\bR^n\times\bR^m$ tout entier). Le thorème 
de Fubini 8.6 donne
$$
\int_{A\times B}f_k(x,y)\,dx\,dy
=\int_A\Big(\int_B f_k(x,y)\,dy\Big)dx
\le\int_A\Big(\int_B f(x,y)\,dy\Big)dx<+\infty.
$$
On en déduit l'intégrabilité de $f$ sur $A\times B$ à l'aide
du théorème de convergence monotone 4.5, et on applique maintenant
de nouveau 8.6 pour obtenir l'égalité des intégrales.\qed
\medskip

D'après les théorèmes de Fubini 8.6 et de Tonelli 8.7, dans le
cas particulier où $f=\chi_E$ est la fonction caractéristique d'un
ensemble mesurable $E$ dans $\bR^n=A\times B=\bR^{n-1}\times\bR$, on 
déduit la formule suivante permettant le calcul d'aires et de volumes
par récurrence sur la dimension.
\medskip

{\bf (8.8) Calcul d'aires et de volumes par récurrence sur la 
dimension.} {\it Soit
$E$ une partie mesurable de $\bR^n$. On note $a_E(x_n)$ l'aire 
$($ou plus précisément la mesure $(n-1)$-dimen\-sion\-nelle$)$ de la
projection dans $\bR^{n-1}$ de la tranche 
$E\cap(\bR^{n-1}\times\{x_n\})$. Alors cette tranche 
$E\cap(\bR^{n-1}\times\{x_n\})$
est \hbox{$\bR^{n-1}$-mesurable} pour presque tout $x_n\in\bR$, la fonction
$x_n\mapsto a_E(x_n)$ est mesurable sur $\bR$ et on a l'égalité
$$
\vol(E)=\int_\bR a_E(x_n)\,dx_n
$$
$($que les intégrales soient finies ou non$)$.}

\vbox{%
\InsertFig 12.000 57.000 {
1 mm unit
  5.000  10.000 moveto  97.000   0.000 2.4 vector 
 10.000   5.000 moveto  45.000  90.000 2.4 vector 
[ 1.000   0.500 ] 0 setdash
 11.200  32.000 moveto  29.100  32.000 lineto stroke
 11.200  34.000 moveto  29.100  34.000 lineto stroke
[ ] 0 setdash
  0.200 setlinewidth
 18.000  24.000 moveto 
[  18.000  24.000
   18.000  24.500   25.000  27.000   38.000  44.000   46.000  40.000 
   56.000  43.000   60.000  42.000   75.000  41.000   80.000  40.500  
   80.000  40.000   80.000  39.500
   72.000  20.000   55.000  16.000   32.000  15.000   18.000  23.500
] curve closepath
gsave
  0.940   0.960   0.980 setrgbcolor  fill
 29.100  32.000 moveto   79.100  32.000 lineto  
 79.100  34.000 lineto   29.100  34.000 lineto
 closepath
  gsave
  1.000   0.840   0.840 setrgbcolor fill
  grestore
  1.000   0.000   0.000 setrgbcolor stroke
grestore
  0.000 setgray stroke
  0.339 setlinewidth
 10.000  32.000 moveto   0.700  90.000 indent
 10.000  34.000 moveto   0.700  90.000 indent 
}
\LabelTeX   46.000  22.500 $\vol(E)$\ELTX
\LabelTeX    5.000  30.600 $x_n$\ELTX
\LabelTeX   -5.000  34.200 $x_n+dx_n$\ELTX
\LabelTeX   92.000   6.200 $x_1,\dots,x_{n-1}$\ELTX
\LabelTeX    5.000  48.800 $x_n$\ELTX
\LabelTeX   46.800  35.500 $a_E(x_n)\,dx_n$\ELTX
\EndFig
\vskip-8pt
\centerline{{\bf Fig.~24.} Calcul de volume par tranchage suivant 
la direction $x_n$.}}
\medskip

{\it Démonstration.} On se ramène au cas d'un ensemble intégrable en
remplaçant $E$ par $E_k=E\cap[-k,k]^n$, et dans cette situation la formule
résulte de l'application du théo\-rème de Fubini à $f_k=\chi_{E_k}$.
Le cas général s'obtient grâce au théorème de 
convergence monotone 4.5 appliqué aux suites croissantes 
$\chi_{E_k}\to\chi_E$, et, pour presque tout
$x_n\in\bR$, $a_{E_k}(x_n)\to a_E(x_n)$.\qed
\bigskip

\section{9. Fonctions de puissance k-ième intégrable}

L'objet de cette section est d'introduire des espaces $L^k(P)$ 
qui généralisent l'espace $L^1(P)$ introduit à la section~5. La
présentation en est tout à fait classique.
\medskip

{\bf (9.1) Définition.} {\it Soit $P$ un pavé quelconque dans $\bR^n$
et $k\in{}]0,+\infty[$. On définit l'espace $\tilde L^k(P)$ comme étant 
l'ensemble des fonctions $f: P\to\bR$ mesurables
telles que $|f|^k$ soit HK-intégrable sur~$P$.
\vskip0pt
On dit que $\tilde L^k(P)$ est l'espace des fonctions de puissance
$k$-ième intégrable sur~$P$. Si $f\in \tilde L^k(P)$, on définit la 
norme $L^k$ de $f$ comme étant
$$
\Vert f\Vert_k=\Big(\int_P|f(x)|^kdx\Big)^{1/k}.
$$}

Nous avons besoin d'un lemme préparatoire fournissant un certain nombre
d'inégalités élémentaires de convexité.
\medskip

{\bf (9.2) Lemme.} {\it Soient $x,\,y\in\bR_+$ des réels positifs ou nuls
et $t>0$.\smallskip
Si $k\ge 1$ on a
$$
\leqalignno{
&(x+y)^k\le \alpha^{1-k}x^k+\beta^{1-k}y^k\quad\hbox{
pour $\alpha,\beta>0$,~ $\alpha+\beta=1$,}&(9.2\,{\rm a})\cr
&(x+y)^k\ge x^k+y^k,&(9.2\,{\rm b})\cr
&|x-y|^k\le |x^k-y^k|,&(9.2\,{\rm c})\cr
&|x^k-y^k|\le t^{-(k-1)}|x-y|^k+
(k-1)t\max(x^k,y^k).&(9.2\,{\rm d})\cr}
$$
Si $0<k\le 1$ on a les inégalités analogues
$$
\leqalignno{
&(x+y)^k\ge \alpha^{1-k}x^k+\beta^{1-k}y^k\quad\hbox{
pour $\alpha,\beta>0$,~ $\alpha+\beta=1$,}&(9.2\,{\rm a}')\cr
&(x+y)^k\le x^k+y^k,&(9.2\,{\rm b}')\cr
&|x-y|^k\ge |x^k-y^k|,&(9.2\,{\rm c}')\cr
&|x-y|^k\le t^{-(1-k)}|x^k-y^k|+(1-k)t^k\max(x^k,y^k).
&(9.2\,{\rm d}')\cr}
$$}%
{\it Démonstration.} (a) résulte de la convexité de la fonction
$x\mapsto x^k$ sur $\bR_+$ (la dérivée seconde $k(k-1)x^{k-2}$
étant${}\ge 0$ sur $]0,+\infty[$ si $k\ge 1$), qui donne
$$
(x+y)^k=\big(\alpha(\alpha^{-1}x)+\beta(\beta^{-1}y)\big)^k
\le \alpha(\alpha^{-1}x)^k+\beta(\beta^{-1}y)^k.
$$
De même, (a${}'$) est une conséquence du fait que la fonction est concave
si $0<k\le 1$.

Les inégalités (b) et (b${}'$) résultent de la monotonie de la fonction
$u\mapsto(u+y)^k-u^k$ sur l'intervalle $[0,x]$, qui se déduit du
fait que la dérivée $k((u+y)^{k-1}-u^{k-1})$ est${}\ge0$
et $k\ge 1$ (resp.${}\le0$ pour $k\le 1$) et $u>0$.

Les inégalités (c) et (c${}'$) se déduisent de (b) et (b${}'$)~: 
en supposant par exemple \hbox{$0\le y\le x$}, on trouve ainsi pour $k\ge 1$
$$
x^k=\big(y+(x-y)\big)^k\ge y^k+(x-y)^k.
$$
Enfin, pour obtenir (d), on utilise l'inégalité des accroissements finis
$$
|x^k-y^k|\le k|x-y|\max(x^{k-1},y^{k-1})=k\,A^{1/k}B^{1-1/k}
$$
avec $A=|x-y|^k$ et $B=\max(x^k,y^k)$, et
on combine ceci avec l'inégalité de convexité
$$
A^{1/k}B^{1-1/k}=\exp\Big({1\over k}\ln(t^{-(k-1)}A)+
\Big(1-{1\over k}\Big)\ln(tB)\Big)\le
{1\over k}t^{-(k-1)}A+\Big(1-{1\over k}\Big)tB.
$$
Pour (d${}'$), on pose $x'=x^k$, $y'=y^k$ et $k'=1/k$, ce qui donne
$$
|x-y|=\big|(x')^{k'}-(y')^{k'}\big|\le k'|x'-y'|
\max\big((x')^{k'-1},(y')^{k'-1}\big),
$$
d'où
$$
|x-y|^k\le \Big({1\over k}|x^k-y^k|\max(x,y)^{1-k}\Big)^k=A^kB^{1-k}
$$
avec $A={1\over k}|x^k-y^k|$ et $B=\max(x^k,y^k)$. Il suffit alors de 
combiner cette inégalité avec l'inégalité de convexité
$$
A^kB^{1-k}=\exp\big(k\ln(t^{-(1-k)}A)+
(1-k)\ln(t^kB)\big)\le
k\,t^{-(1-k)}A+(1-k)t^kB.\eqno\square
$$

{\bf (9.3) Théorème.} {\it Soit $P$ un pavé quelconque de $\bR^n$.
{\parindent=6.5mm
\item{\rm (a)} L'ensemble $\tilde L^k(P)$ est un espace vectoriel,
et $f\mapsto \Vert f\Vert_k$ est une semi-norme sur $\tilde L^k(P)$ si
$k\ge 1$ $($c'est seulement une «\?quasi semi-norme\?» si
$0<k<1)$.
\item{\rm (b)} L'ensemble des fonctions $f$ de semi-norme $\Vert f\Vert_k$
nulle s'identifie à l'espace $N(P)$ des fonctions négligeables, et
le quotient $L^k(P)=\tilde L^k(P)/N(P)$ est un espace complet pour
tout $k>0$ $($et donc un espace de Banach si $k\ge 1)$.
\vskip0pt}}
\medskip

{\it Démonstration.} (a) Soient $f,\,g\in \tilde L^k(P)$. 
L'inégalité (9.2$\,$b${}'$) implique 
$$
|f+g|^k\le (|f|+|g|)^k\le |f|^k+|g|^k\qquad\hbox{si $0<k\le 1$},
$$
tandis que pour $k\ge 1$ et $\alpha,\,\beta>0$, 
$\alpha+\beta=1$, (9.2$\,$a) donne
$$
\big|f+g\big|^k\le\alpha^{1-k}|f|^k+\beta^{1-k}|g|^k.
\leqno(*)
$$
La proposition 7.10 implique que
$f+g\in \tilde L^k(P)$. Ceci montre que $\tilde L^k(P)$ est bien un 
espace vectoriel et que
$$
\Vert f+g\Vert_k^k\le\Vert f\Vert_k^k+\Vert g\Vert_k^k\qquad
\hbox{si $0<k\le 1$}.
$$
Dans ce cas, à défaut d'obtenir une semi-norme, on obtient donc une 
semi-distance 
invariante par translation en posant $d_k(f,g)=\Vert f-g\Vert_k^k$.
L'élévation à la puissance $1/k$ conduit d'après (9.2$\,$a)
(appliqué avec $k'=1/k$ et $\alpha=\beta=1/2$) à la propriété dite de 
«\?quasi semi-norme\?»
$$
\Vert f+g\Vert_k\le 2^{1/k-1}\big(\Vert f\Vert_k+\Vert g\Vert_k\big).
$$
L'ensemble des fonctions $f$ de semi-norme $\Vert f\Vert_k=0$ s'identifie
à l'ensemble $N(P)$ des fonctions négligeables, et 
dans le cas où $\Vert f\Vert_k=\Vert g\Vert_k=0$ on a donc
$$
\Vert f+g\Vert_k= 0=\Vert f\Vert_k+\Vert g\Vert_k.
$$ 
Si $k\ge 1$ et $\Vert f\Vert_k+\Vert g\Vert_k>0$, on peut appliquer
l'inégalité $(*)$ ci-dessus avec
$$
\alpha={\Vert f\Vert_k\over \Vert f\Vert_k+\Vert g\Vert_k},\qquad
\beta={\Vert g\Vert_k\over \Vert f\Vert_k+\Vert g\Vert_k}
$$
pour obtenir
$$
\eqalign{
\Vert f+g\Vert_k^k
&\le \alpha^{1-k}\Vert f\Vert_k^k+\beta^{1-k}\Vert g\Vert_k^k\cr
&\le(\Vert f\Vert_k+\Vert g\Vert_k)^{k-1}\Vert f\Vert_k+
(\Vert f\Vert_k+\Vert g\Vert_k)^{k-1}\Vert g\Vert_k,\cr}
$$
d'où $\Vert f+g\Vert_k\le\Vert f\Vert_k+\Vert g\Vert_k$.

(b) Il est clair d'après ce qui précède que le quotient 
$L^k(P)=\tilde L^k(P)/N(P)$ est un espace métrisable séparé, 
normé ou quasi-normé suivant que $k\ge 1$ ou $0<k<1$. Pour montrer
que c'est un espace complet, on considère les bijections inverses l'une
de l'autre
$$
\eqalign{
&\Phi:\tilde L^k(P)\to \tilde L^1(P),\qquad f\mapsto f_+^k-f_-^k,\cr
&\Psi:\tilde L^1(P)\to \tilde L^k(P),\qquad f\mapsto f_+^{1/k}-f_-^{1/k}.\cr}
$$
Comme $L^1(P)$ est complet (théorème 5.6), il suffit de voir que $\Phi $ 
et $\Psi$ induisent des homéomorphismes entre $\tilde L^k(P)$ et 
$\tilde L^1(P)$ qui transforment suites de Cauchy en suites de Cauchy.
Soient $f$, $g$ dans~$\tilde L^k(P)$. Il est tout d'abord
évident par définition de $\Phi$ que 
$$
\Vert\Phi(f)\Vert_1=\Vert f\Vert_k^k,
$$
donc $\Phi$, $\Psi$ échangent les parties bornées. Lorsque $k\le 1$,
on a d'après (9.2$\,$c${}'$)
$$
\Vert f_+^k-g_+^k\Vert_1
=\int_P\big|f_+^k(x)-g_+^k(x)\big|\,dx
\le \int_P\big|f_+(x)-g_+(x)\big|^k\,dx \le\Vert f-g\Vert_k^k,
$$
(on utilise le fait trivial que $|x_+-y_+|\le|x-y|$), 
et on a une inégalité analogue pour les parties négatives, donc
$$
\Vert \Phi(f)-\Phi(g)\Vert_1\le 2\,\Vert f-g\Vert_k^k.
$$
Lorsque $k\ge 1$, on utilise plutôt (9.2$\,$d) qui donne
$$
\Vert f_+^k-g_+^k\Vert_1\le 
t^{-(k-1)}\Vert f-g\Vert_k^k +
(k-1)t\max\big(\Vert f\Vert_k,\Vert g\Vert_k\big)^k
$$
pour tout $t>0$. En prenant $t=\Vert f-g\Vert_k$, on trouve alors
$$
\eqalign{
\Vert f_+^k-g_+^k\Vert_1\le 
&\Vert f-g\Vert_k\big(1+(k-1)\max(\Vert f\Vert_k,\Vert g\Vert_k)^k\big),\cr
\Vert \Phi(f)-\Phi(g)\Vert_1\le 
2&\Vert f-g\Vert_k\big(1+(k-1)\max(\Vert f\Vert_k,\Vert g\Vert_k)^k\big).\cr
}
$$
Dans le sens inverse, (9.2$\,$c) implique
$$
\eqalign{
&\Vert f_+ -g_+\Vert_k^k\le \Vert f_+^k -g_+^k\Vert_1
\le \Vert \Phi(f)-\Phi(g)\Vert_1\qquad
\hbox{si $k\ge 1$,~ d'où}\cr
&\Vert f -g\Vert_k\le 2\Vert \Phi(f) -\Phi(g)\Vert_1^{1/k}\qquad
\hbox{si $k\ge 1$.}\cr}
$$
Si $k\le 1$, l'utilisation de (9.2$\,$d${}'$) 
avec $t=\Vert f_+^k -g_+^k\Vert_1$ fournit
$$
\eqalign{
&\Vert f_+ -g_+\Vert_k^k\le \Vert f_+^k -g_+^k\Vert_1^k
\big(1+(1-k)\max(\Vert f\Vert_k,\Vert g\Vert_k)^k\big),\cr
&\Vert f -g\Vert_k\le 2^{1/k}\Vert \Phi(f) -\Phi(g)\Vert_1
\big(1+(1-k)\max(\Vert f\Vert_k,\Vert g\Vert_k)^k\big)^{1/k}.\cr}
$$
La propriété de transformation des suites de Cauchy par $\Phi$ et 
$\Psi=\Phi^{-1}$ résulte directement de ces inégalités, et le 
théorème s'ensuit.\qed
\medskip

{\bf (9.4) Inégalité de Hölder.} {\it Soient $k,\,\ell>1$ tels que
${1\over k}+{1\over \ell}=1$ $($«\?exposants conjugués\?»$)$. 
Alors pour tout $f\in \tilde L^k(P)$ et
tout $g\in \tilde L^{\ell}(P)$ le produit $fg$ est dans $\tilde L^1(P)$
et on a
$$
\Big|\int_Pf(x)g(x)\,dx\Big|\le\Vert f\Vert_k\Vert g\Vert_{\ell}.
$$}

{\it Démonstration.} La convexité de la fonction exponentielle donne
$$
|fg|=\exp\Big({1\over k}\ln(t^k|f|^k)+{1\over \ell}\ln(t^{-\ell}|g|^\ell)\Big)
\le{1\over k}t^k|f|^k+{1\over \ell}t^{-\ell}|g|^\ell
$$
pour tout $t>0$, et ceci montre déjà que $fg\in \tilde L^1(P)$ d'après la
proposition 7.10. On obtient de plus
$$
\Big|\int_Pf(x)g(x)\,dx\Big|\le\int_P|f(x)|\,|g(x)|\,dx
\le{1\over k}t^k\Vert f\Vert_k^k+{1\over \ell}t^{-\ell}\Vert g\Vert_\ell^\ell.
$$
Si on prend $t=\Vert f\Vert_k^{-1/\ell}\Vert g\Vert_k^{1/k}$ (en
supposant $f$, $g$ non négligeables), on déduit\break bien l'inégalité
de Hölder (9.4) cherchée de l'hypothèse ${1\over k}+{1\over \ell}=1$, 
qui entraîne aussi\break
\hbox{$k-k/\ell=\ell-\ell/k=1$}. Si $f$ ou
$g$ est négligeable, le membre de gauche est nul et l'inégalité
est évidente.\qed
\medskip

{\bf (9.5) Remarque.} On notera que l'inégalité de Hölder est également 
valide lorsque $k=1$, si l'on définit l'exposant conjugué par
$\ell=\infty$ dans ce cas. Ce n'est autre que l'inégalité déjà donnée
en~(7.12).
\medskip

{\bf (9.6) Corollaire.} {\it L'espace $L^2(P)=\tilde L^2(P)/N(P)$ des
fonctions de carré intégrable presque partout définies sur $P$ a une 
structure d'espace de Hilbert.}

{\it Démonstration.} Si $f,\,g\in\tilde L^2(P)$, alors 
$|fg|\le{1\over 2}(f^2+g^2)\in\tilde L^1(P)$, donc
$fg\in\tilde L^1(P)$. On peut ainsi
définir sur $L^2(P)$ un produit scalaire
$$
\langle f,g\rangle=\int_Pf(x)g(x)\,dx
$$
tel que $\langle f,f\rangle=\Vert f\Vert_2^2$. Cette forme bilinéaire
positive est bien non dégénérée puisque son noyau dans $\tilde L^2(P)$
est précisément $N(P)$, et que dans $L^2(P)$ on est passé au quotient.
Le théorème 9.3
montre que $L^2(P)$ est un espace de Hilbert. On en tire en
particulier l'inégalité de Cauchy-Schwarz $|\langle
f,g\rangle|\le\Vert f\Vert_2\Vert g\Vert_2$, qui se récrit sous
forme intégrale
$$
\Big(\int_Pf(x)g(x)\,dx\Big)^2\le\int_P|f(x)|^2\,dx\int_P|g(x)|^2\,dx,
\leqno(9.7)
$$
et qui est précisément le cas particulier de l'inégalité de Hölder
pour $k=\ell=2$.\qed
\bigskip 

\section{10. Caractérisation de l'intégrabilité au sens de Riemann}

Les résultats qui précèdent permettent de donner une caractérisation des
fonctions intégrables au sens de Riemann.
\medskip

{\bf (10.1) Théorème.} {\it Soit $P$ un pavé fermé borné de $\bR^n$ et
$f:P\to\bR$ une fonction quelconque. Alors $f$ est intégrable au sens
de Riemann sur $P$ si et seulement si
{\parindent=6.5mm
\item{\rm(a)} $f$ est bornée sur $P\,;$
\item{\rm(b)} l'ensemble $N$ des points de discontinuité de $f$ est
une partie négligeable de $P$.
\medskip}}

{\it Démonstration.} (1) Les conditions sont {\it nécessaires}.

Supposons  $f$ intégrable au sens de Riemann. Alors, pour $\varepsilon>0$
donné, il existe $\delta>0$ tel que pour toute subdivision
$D=\{(Q_j,x_j)\}_{0\le j<N}$ $\delta$-fine on ait
$|S_D(f)-A|\le\varepsilon$ où $A$ est l'intégrale de $f$, ce qui exige
que $S_D(f)=\sum f(x_j)\vol(Q_j)$ reste borné. En fixant un indice $j$ et
en faisant varier $x_j\in Q_j$ (tous les autres points $x_k\in Q_k$, 
$k\ne j$, étant fixés), on voit que $f$ doit être bornée sur $Q_j$. Par
conséquent $f$ doit être bornée sur $P$.

Si nous posons maintenant $M_j=\sup_{x_j}f(x_j)$ et 
$m_j=\inf_{x_j\in Q_j}f(x_j)$, nous voyons que
$\sum M_j\vol(Q_j)\le A+\varepsilon$ et
$\sum m_j\vol(Q_j)\ge A-\varepsilon$ en prenant respectivement le
sup et l'inf de $S_D(f)$. Par conséquent
$\sum (M_j-m_j)\vol(Q_j)\le 2\varepsilon$.
Soit $J_0$ l'ensemble des indices tels que $M_j-m_j\ge \sqrt{\varepsilon}$.
On obtient $\sum_{j\in J_0}\sqrt{\varepsilon}\vol(Q_j)\le 2\varepsilon$, donc
$\vol(\bigcup Q_j)\le 2\sqrt{\varepsilon}$. Du fait que $\vol(\partial Q_j)=0$,
il existe un voisinage ouvert
$$
U_\varepsilon\quad\hbox{de}\quad
\bigcup_{j\in J_0}Q_j\cup\bigcup_{j\notin J_0}\partial Q_j
$$
tel que $\vol(U_\varepsilon)\le 4\sqrt{\varepsilon}$. Le complémentaire
$P\ssm U_\varepsilon$ est contenu par construction dans la réunion des
cubes ouverts $Q_j^\circ$, $j\notin J_0$, donc tout point
$x_0\in P\ssm U_\varepsilon$ admet un voisinage sur lequel l'oscillation
de $f$ est majorée par $\sqrt{\varepsilon}$ 
(puisque $M_j-m_j<\sqrt{\varepsilon}$ pour $j\notin J_0$).

Considérons l'ensemble négligeable
$$
S=\bigcup_{k\ge 1}~\bigcap_{j\ge k}U_{1/j}\quad
\hbox{et son complémentaire}\quad
P\ssm S=\bigcap_{k\ge 1}~\bigcup_{j\ge k}P\ssm U_{1/j}.
$$
(On notera que $\vol(\bigcap_{j\ge k}U_{1/j})\le 4/\sqrt{j}$ pour tout
$j\ge k$, donc cet ensemble est bien négligeable). Alors, pour tout 
$x_0\in P\ssm S$
et tout entier $k\ge 1$, il existe  $j\ge k$ tel que $x_0\in P\ssm U_{1/j}$,
et par conséquent $x_0$ possède un voisinage sur lequel l'oscillation
de $f$ est majorée par $\sqrt{1/j}\le\sqrt{1/k}$. Ceci implique que
$f$ est continue en $x_0$ et donc $N\subset S$.
\medskip

(2) Réciproquement, supposons que $|f|\le M$ et que l'ensemble $N$ des
points de discontinuité de $f$ soit négligeable.
Fixons $\varepsilon>0$ et posons
$$
S_k=\{x\in P\,;\exists\delta>0,\;\oscil_{\ovl B(x,2^{-k}-\delta)}f
\ge \varepsilon\}.
$$
Il est clair par définition que $S_k$ est une 
suite décroissante et que $S_k$ est une partie ouverte de $P$ 
(si $x_0\in S_k$ avec $\oscil_{\ovl B(x_0,2^{-k}-\delta)}f\ge\varepsilon$,
alors pour $x\in B(x_0,\delta/2)$ on a 
$\oscil_{\ovl B(x,2^{-k}-\delta/2)}f\ge
\oscil_{\ovl B(x_0,2^{-k}-\delta)}f\ge\varepsilon$). Comme
$N=\bigcap S_k$ est de mesure nulle, il existe 
un entier $k$ tel que la mesure de
Lebesgue de $S_k$ satisfasse $\mu(S_k)\le\varepsilon$.

Considérons un 
recouvrement fini du compact $P\ssm S_k$ par des pavés ouverts $(Q'_j)^\circ$
centrés en 
des points $x'_j\in P\ssm S_k$, de diagonale${}<2^{-k}$. On a 
$Q'_j\subset B(x'_j,2^{-k}-\delta)$ pour~$\delta$ assez petit,
et comme $x'_j\notin S_k$, il vient
$$
\oscil_{B(x'_j,2^{-k}-\delta)}f<\varepsilon\quad\hbox{et donc}\quad
\oscil_{Q'_j}f<\varepsilon.
$$
On obtient ainsi un recouvrement $\bigcup (Q'_j)^\circ$ d'un voisinage de 
$P\ssm S_k$. On complète la réunion $\bigcup Q'_j$
pour recouvrir $P$ tout entier en adjoignant un nombre fini de pavés 
$Q''_j\subset S_k$ dont les intérieurs $(Q''_j)^\circ$ sont deux à 
deux disjoints et contenus dans $P\ssm\bigcup Q'_j$.

Soit $P=\bigcup Q_\ell$ un découpage de $P$ obtenu en redécoupant
les pavés $Q'_j$ et $Q''_j$ de sorte que $Q_\ell\subset Q'_j$ ou
$Q_\ell\subset Q''_j$ pour au moins un $j$. On pose
$$
M_\ell=\sup_{Q_\ell}f,\qquad m_\ell=\inf_{Q_\ell}f.
$$
Pour $Q_\ell\subset Q'_j$ on a $M_\ell-m_\ell\le\oscil_{Q_\ell}\le
\oscil_{Q'_j}f<\varepsilon$, et d'autre part $\bigcup Q''_j\subset S_k$, donc
$$
\eqalign{
\sum_\ell(M_\ell-m_\ell)\vol(Q_\ell)
&\le
\sum_{Q_\ell\subset\bigcup Q'_j}(M_j-m_j)\vol(Q_j)+
\sum_{Q_\ell\subset\bigcup Q''_j}(M_j-m_j)\vol(Q_j)\cr
&\le
\varepsilon\sum_{Q_\ell\subset\bigcup Q'_j}\vol(Q_j)+
M\sum_{Q_\ell\subset\bigcup Q''_j}\vol(Q_j)\cr
&\le
\varepsilon\vol(P)+M\mu(S_k)\le (\vol(P)+M)\varepsilon.\cr
}
$$
Ceci démontre que $f$ est intégrable au sens de Riemann.\qed
\bigskip

\section{11. Fonctions approximativement continues et primitives}

Soit $\Omega$ un ouvert de $\bR^n$, $E$ un espace métrique (ou topologique)
ayant une base dénombrable d'ouverts.
\medskip

{\bf (11.1) Définition.} {\it On dit qu'une application $f:\Omega\to E$ est
{\parindent=6.5mm
\item{\rm(a)} {\rm mesurable} si pour tout ouvert $V$ de $E$ l'image réciproque
$f^{-1}(V)$ est mesurable$\;;$
\item{\rm(b)} {\rm approximativement continue} en un point $x_0\in\Omega$ 
$($relativement à la mesure de Lebesgue $\mu)$ si elle est mesurable
au voisinage de $x_0$ et si pour tout voisinage ouvert
$V$ de~$f(x_0)$, la densité des points $x$ proches de
$x_0$ dont l'image $f(x)$ est en dehors de~$V$ est nulle, c'est-à-dire~$:$
$$
\limsup_{r\to 0_+}{\mu\big(B(x_0,r)\ssm f^{-1}(V)\big)
\over \mu\big(B(x_0,r)\big)}=0.
$$
\item{\rm(c)} {\rm approximativement continue sur} $\Omega$ si elle
est continue en tout point de~$\Omega$.
\medskip
}}

Il est facile de voir que la condition 11.1~(b) est indépendante de
la norme choisie sur~$\bR^n$. Pour les fonctions d'une variable, la
condition devient
$$
\forall V~\hbox{ouvert}~\ni f(x_0),\qquad
\limsup_{h\to 0_+}{\mu\big(]x_0-h,x_0+h[{}\ssm f^{-1}(V)\big)
\over 2h}=0.\leqno(11.2)
$$
L'énoncé suivant est à peu près évident.
\medskip

{\bf (11.3) Proposition} {\it Soit $f:\Omega\to E$ une application
approximativement continue en un point $x_0\in\Omega$ et $g:E\to E'$
une application continue entre espace topologiques. Alors $g\circ f$
est approximativement continue en~$x_0$.}
\medskip

{\it Démonstration.} En effet, si $W$ est un voisinage de $g\circ f(x_0)$ alors
$V=g^{-1}(W)$ est un voisinage de $f(x_0)$ et
$(g\circ f)^{-1}(W)=f^{-1}(V)$.\qed
\medskip

L'intérêt principal des fonctions approximativement continues réside dans
le  résultat élémentaire suivant dû à A.~Denjoy.
\medskip

{\bf (11.4) Théorème} {\rm (Denjoy [Dj2]).} {\it Soit $I$ un intervalle de 
$\bR$ et $f:I\to\bR$ une fonction mesurable bornée et approximativement
continue en un point $x_0\in I$. Alors l'intégrable indéfinie 
$$
F(x)=\int_a^x f(t)\,dt,\qquad a\in I
$$
est dérivable en $x_0$ et $F'(x_0)=f(x_0)$. En particulier, toute fonction
$f:I\to\bR$ localement bornée et approximativement continue possède
une primitive.}
\medskip

{\it Démonstration.} Considérons un point $x=x_0+h\in I$, $h\in\bR$,
et fixons $\varepsilon>0$. En posant $M=\Vert f\Vert_\infty$ et
$V={}]f(x_0)-\varepsilon,f(x_0)+\varepsilon[$, on a alors
$$
{F(x_0+h)-F(x_0)\over h}-f(x_0)={1\over h}\int_{x_0}^{x_0+h}
\big(f(t)-f(x_0)\big)\,dt,
$$
et comme car $|f(t)-f(x_0)|\le\varepsilon$ pour $t\in f^{-1}(V)$ et
$|f(t)-f(x_0)|\le 2M$ presque partout pour $t\notin f^{-1}(V)$, il
vient
$$
\eqalign{
\Big\vert{F(x_0+h)-F(x_0)\over h}-f(x_0)\Big\vert
&\le{1\over |h|}\int_{]x_0,x_0+h[\cap f^{-1}(V)}
\big|f(t)-f(x_0)\big|\,dt\cr
&\kern40pt{}+{1\over |h|}\int_{]x_0,x_0+h[\ssm f^{-1}(V)}
\big|f(t)-f(x_0)\big|\,dt\cr
&\le\varepsilon+{2M\,\mu\big(]x_0,x_0+h[\ssm f^{-1}(V)\big)\over |h|}.\cr}
$$
L'hypothèse sur la continuité approximative de $f$ implique qu'il existe
$\delta>0$ tel que
$$
\eqalign{
0<|h|<\delta
&~~\Longrightarrow~~
{\mu\big(]x_0-h,x_0+h[\ssm f^{-1}(V)\big)\over 2|h|}\le\varepsilon\cr
&~~\Longrightarrow~~
\Big\vert{F(x_0+h)-F(x_0)\over h}-f(x_0)\Big\vert\le \varepsilon(1+4M).\cr}
$$
Les résultats annoncés en découlent.\qed
\medskip

{\bf (11.5) Corollaire.} {\it Une fonction approximativement continue 
$f:I\to \overline\bR$ satisfait le théorème des valeurs intermédiaires.}
\medskip

{\it Démonstration.} En effet, quitte à composer $f$ avec un 
homéomorphisme \hbox{$g:\ovl\bR\to[-1,1]$,\kern-1pt}
on peut supposer $f$ bornée.
Alors $f$ admet une primitive $F$, et on sait que la dérivée $f=F'$ satisfait
le théorème des valeurs intermédiaires.\qed
\medskip

Le théorème de Denjoy permet de construire des fonctions dont la dérivée
est approxi\-mativement continue mais discontinue en de nombreux points.
\medskip

{\bf (11.6) Proposition} {\rm (Denjoy [Dj2]).} {\it Soit $(r_n)_{n\ge n_0}$
une suite partout dense dans $\bR$ $($par~exemple la suite des rationnels
ordonnés de manière quelconque$)$,
et $\alpha_n>0$, $\beta_n>1$, $n\ge n_0$, des suites de réels telles~que 
$$
\sum_{n=n_0}^{+\infty} \alpha_n<+\infty,\qquad 
\sum_{n=n_0}^{+\infty} K^{-\beta_n}
<+\infty
$$
pour une certaine constante $K>1$ $($on peut prendre par exemple
$\alpha_n=2^{-n}$, $\beta_n=\ln n$, $n\ge n_0=3$, avec $K= e^2)$. Alors
{\parindent=6.5mm
\item{\rm(a)} la fonction $u:\bR\to[0,+\infty]$ telle que
$$u(x)=\sum_{n=n_0}^{+\infty}\alpha_n|x-r_n|^{-1/\beta_n}$$
est approximativement continue sur $\bR$, finie presque partout, mais
infinie sur un $G_\delta$ dense de mesure nulle dans $\bR$.
\item{\rm(b)} la fonction $f(x)=e^{-u(x)}\cos u(x)$ est mesurable
sur $\bR$, bornée par $1$ en valeur absolue, approximativement
continue en tout point, et change de signe sur tout intervalle.
En particulier, elle admet une primitive $F$ qui n'est monotone
sur aucun intervalle. De plus $f$ est continue avec $f(x_0)=0$ 
en tout point $x_0$ tel que $u(x_0)=+\infty$, et discontinue en
tout point $x_0$ tel que $u(x_0)<+\infty$.\medskip}}
\medskip

{\it Démonstration.} (a) Considérons les fonctions $u_n:\bR\to[0,+\infty]$
définies par \hbox{$u_n(x)=\alpha_n|x-r_n|^{-1/\beta_n}$}. Elles sont
continues, avec $u_n(r_n)=+\infty$ et $u_n(x)<+\infty$ si
$x\ne r_n$, donc les sommes partielles 
$$
S_N=\sum_{n_0\le n\le N}u_n
$$
sont continues. Par conséquent, la limite croissante $u=\lim S_N$ est
semi-continue inférieurement, c'est-à-dire que pour tout
$\lambda<u(x_0)$ il existe un voisinage $]x_0-\delta,x_0+\delta[$ sur
lequel $u(x)>\lambda$ (que $u(x_0)$ soit fini ou infini) -- pour le
voir, on choisit $N$ tel que $S_N(x_0)>\lambda$, puis $\delta>0$ tel
que $S_N(x)>\lambda$ sur $]x_0-\delta,x_0+\delta[$, en utilisant la
continuité de~$S_N$.

Il suffira donc de montrer que $u$ est approximativement semi-continue
supérieurement, c'est-à-dire que pour tout $x_0\in\bR$ tel que
$u(x_0)<+\infty$ et tout $\lambda>u(x_0)$, l'ensemble
$u^{-1}(]\lambda,+\infty])$ est de densité nulle en~$x_0$.

Par hypothèse, la suite $\beta_n$ doit vérifier $\lim K^{-\beta_n}=0$, donc
$\lim\beta_n=+\infty$, ce qui implique l'existence d'une borne inférieure
$\beta=\inf\beta_n=\min\beta_n>1$. Pour tout intervalle $[-A,A]$ et $r\ge 0$
on a
$$
\eqalign{
\int_{-A}^A|x-r|^{-1/\beta}dx
&=\int_{-A-r}^{A-r}|x|^{-1/\beta}dx\cr
&=\int_{-A}^A|x|^{-1/\beta}dx+\int_A^{A+r}(|x|^{-1/\beta}-|x-r|^{-1/\beta})dx
\cr
&\le\int_{-A}^A|x|^{-1/\beta}dx=2(1-1/\beta)^{-1}A^{1-1/\beta},\cr}
$$
et, par symétrie, on a la même inégalité pour $r\le 0$. Ceci entraîne 
pour tout $N$
$$
\int_{-A}^AS_N(x)\,dx\le 2(1-1/\beta)^{-1}A^{1-1/\beta}\sum_{n=n_0}^N\alpha_n.
$$
Le théorème de convergence monotone implique dans ces conditions que
$u=\lim S_N$ est intégrable au sens de Lebesgue sur tout intervalle
$[-A,A]$, avec
$$
\int_{-A}^A u(x)\,dx
\le 2(1-1/\beta)^{-1}A^{1-1/\beta}\sum_{n=n_0}^{+\infty}\alpha_n.
$$
En particulier, on a $u(x)<+\infty$ presque partout. En revanche,
$u^{-1}(+\infty)=\bigcap_{\lambda\in\bN}u ^{-1}(]\lambda,+\infty])$
est un $G_\delta$ qui contient la suite $\{r_n\}$, donc c'est un
$G_\delta$ dense, de mesure nulle d'après ce qui précède.

Fixons maintenant $x_0$ tel que $u(x_0)=\sum\alpha_n|x_0-r_n|^{-1/\beta_n}
<+\infty$ et un réel $\varepsilon>0$. Ceci~implique en particulier
que $x_0\notin\{r_n\}$. L'ensemble des points 
$x\in\bR$ tel que $u_n(x)>Ku_n(x_0)$ est l'intervalle $J_n$ défini par
$|x-r_n|<K^{-\beta_n}|x_0-r_n|$. Pour que l'intervalle $J_n$ rencontre un
intervalle donné $]x_0-h,x_0+h[$, il faut que la distance séparant les
centres des intervalles soit plus petite que la somme de leurs demi-longueurs,
soit $|x_0-r_n|<h+K^{-\beta_n}|x_0-r_n|$, et donc
$|x_0-r_n|<(1-K^{-1})^{-1}h$. Par conséquent, la longeur d'un tel intervalle
$J_n$ est majorée par 
$$
2K^{-\beta_n}|x_0-r_n|<2K^{-\beta_n}(1-K^{-1})^{-1}h
$$
et on en déduit
$$
{1\over 2h}\mu\Big(]x_0-h,x_0+h[{}\cap\bigcup_{n>N}J_n\Big)\le
\sum_{n>N}K^{-\beta_n}(1-K^{-1})^{-1}.\leqno(11.7)
$$
Comme la série $\sum K^{-\beta_n}$ converge par hypothèse, on peut fixer
un entier $N$ tel que $\sum_{n>N}K^{-\beta_n}(1-K^{-1})^{-1}<\varepsilon$,
et on peut supposer également par ailleurs que 
$\sum_{n>N}u_n(x_0)<\varepsilon/2K$. Pour $x\in{}]x_0-h,x_0+h[{}\ssm
\bigcup_{n>N}J_n$ nous avons
$$\eqalign{
u(x)&\le \sum_{n_0\le n\le N}u_n(x)+\sum_{n>N}u_n(x)\cr
&\le\sum_{n_0\le n\le N}u_n(x)+K\sum_{n>N}u_n(x_0)
\le\sum_{n_0\le n\le N}u_n(x)+\varepsilon/2.\cr}
$$
Par continuité de $u_n$, on peut choisir $\delta>0$ assez petit en sorte
que $h\le\delta$ et $x\in{}]x_0-h,x_0+h[{}\Rightarrow u_n(x)<u_n(x_0)
+\varepsilon/2N$, d'où $u(x)\le u(x_0)+\varepsilon$ d'après l'inégalité
précédente. Ceci montre que pour $h\le\delta$, les points de $]x_0-h,x_0+h[$
en lesquels $u(x)>u(x_0)+\varepsilon$ sont contenus dans
$]x_0-h,x_0+h[{}\cap\bigcup_{n>N}J_n$, et donc que leur densité
est majorée par $\varepsilon$ d'après (11.7) et le choix de~$N$.
On en conclut que la limite de cette densité est nulle, et donc que
$u$ est bien approximativement semi-continue supérieurement en~$x_0$.

(b) La fonction $g(x)=e^{-x}\cos x$ définie sur $[0,+\infty[$ admet un
maximum qui vaut $g(0)=1$, et un minimum égal à $g(3\pi/4)=m$ où
$m=-\smash{\sqrt{2}\over 2}e^{-3\pi/4}$. Elle se prolonge en une application
continue $g:[0,+\infty]\to [m,1]$ en posant $g(+\infty)=0$. On en déduit
que la composée $f(x)=g\circ u(x)=e^{-u(x)}\cos u(x)$ est approximativement
continue sur $\bR$ tout entier, avec $\Vert f\Vert_\infty\le 1$. Elle
admet donc une primitive $F$. Comme $u(r_n)=+\infty$ et que $u$ satisfait
le théorème des valeurs intermédiaires, on voit que $f$ prend tous
les signes $+,-,0$ au voisinage de chaque point $r_n$, et donc sur tout
intervalle ouvert de~$\bR$. Il résulte de (a) que $f(x)=0$ sur le $G_\delta$
dense de mesure nulle $u^{-1}(+\infty)$ [il~s'agit de points où
$f$ est continue], en revanche $f$ est discontinue en tout
point $x_0$ où $u(x_0)<+\infty$ puisqu'il va y avoir des points 
$r_n$ arbitrairement
proches en lesquels $u(r_n)=+\infty$ et donc $f(x)$ va prendre toute valeur
de l'intervalle $g([u(x_0),+\infty[)$ aussi près qu'on veut de~$x_0$.\qed
\medskip

Nous présentons maintenant un exemple montrant qu'une fonction dérivée peut
avoir un comportement très pathologique au sens de Lebesgue, même
lorsque la théorie de Henstock-Kurzweil permet d'intégrer une telle
fonction sans difficulté.
\medskip

{\bf (11.8) Proposition} {\it Soit $(r_n)_{n\ge n_0}$
une suite partout dense dans $\bR$ $($par~exemple la suite des rationnels
ordonnés de manière quelconque$)$,
et $\alpha_n>0$, $\beta_n>0$, $n\ge n_0$, des suites de réels positifs 
telles~que
$$
\sum_{n\ge n_0}\beta_n<+\infty,\qquad
\sum_{n\ge n_0}\alpha_n\beta_n^{-1}<+\infty.
$$
On considère les fonctions $v:\bR\to\bR$ et $f:\bR\to\bR$ telles que
$$
\eqalign{
v(x)&=x^2\sin{1\over x^3}\quad\hbox{si $x\ne 0$},\qquad v(0)=0,\cr
\noalign{\vskip5pt}
f(x)&=\sum_{n\ge n_0}\alpha_n\,v\big(\beta_n^{-1}(x-r_n)\big).\cr}
$$
Alors$~:$
{\parindent=6.5mm
\item{\rm(a)} $f$ est une fonction continue bornée sur $\bR$.
\item{\rm(b)} $f$ est dérivable presque partout sur $\bR$.
\item{\rm(c)} Si les suites $(r_n)$,
$(\alpha_n)$ et $(\beta_n)$ vérifient les conditions supplémentaires
$$
\beta_p\le {1\over 2}\;\min_{n<p}|r_n-r_p|,\qquad
\lim {\alpha_n\beta_n^2\over\beta_{n+1}}=+\infty,
$$
la fonction $f'$ n'est intégrable au sens de Lebesgue
sur aucun intervalle de $\bR$.{\parindent=0cm\note{22}{D'après le
théorème 7.13, on en déduit aussi que $f'$ n'est alors HK-intégrable
sur aucun intervalle. On notera que ceci se produit bien que $f'$ 
soit somme d'une série presque
partout convergente de fonctions HK-intégrables dont la série
des intégrales indéfinies converge normalement, de sorte que $f'$
définit tout de même une distribution dont la primitive est la
fonction continue $f$.}}\medskip}}

On notera que si $(r_n)_{n\ge 1}$ est la suite des rationnels distincts
énumérés en sorte que le dénominateur de $r_n$ soit inférieur ou égal
à~$n$, alors $|r_n-r_p|\le 1/np$ pour $n<p$, et par conséquent les
suites $\beta_n=2^{-5^n}$ et $\alpha_n=\beta_n^2=4^{-5^n}$ satisfont 
toutes les hypothèses.
\medskip

{\it Démonstration.} L'inégalité $|\sin x|\le |x|$ 
implique $|v(x)|\le 1/|x|$, donc $|v(x)|\le 1$ sur $\bR$ tout entier
(cette majoration étant triviale par définition si $x\in[-1,1]$).
On observe également que $v$ est partout dérivable sur $\bR$ avec 
$v'(0)=\lim\limits_{x\to 0}v(x)/x=0\;$ et
$$
v'(x)=2x\sin{1\over x^3}- {3\over x^2}\cos{1\over x^3}
\qquad\hbox{si $x\ne 0$},
$$
par conséquent
$$
|v'(x)|\le {5\over |x|^2}\qquad\hbox{si $x\ne 0$}.\leqno(11.9)
$$

(a) {\it Continuité de $f$.} Puisque la convergence de $\sum \beta_n$
entraîne $\lim\beta_n=0$, 
la convergence de $\sum\alpha_n\beta_n^{-1}$ implique
celle de $\sum \alpha_n$. Par conséquent, du fait que $v$ est continue bornée,
nous voyons que $f(x)=\sum_{n\ge n_0}\alpha_n\,v\big(\beta_n^{-1}(x-r_n)\big)$
est continue bornée comme somme d'une série uniformément convergente 
de telles fonctions. 

(b) {\it Différentiabilité de $f$ presque partout.}
Considérons l'ensemble
$$
E=\bigcap_{N\ge n_0}~\bigcup_{n\ge N}{}]r_n-\beta_n,r_n+\beta_n[{}\,,
$$
qui est négligeable en vertu de l'hypothèse 
$\sum\beta_n<+\infty$. Pour $x\in\bR\ssm E$, il existe un indice
$N(x)$ tel $x\notin{}\bigcup_{n\ge N(x)}{}]r_n-\beta_n,r_n+\beta_n[$.
Ceci implique $|v'(\beta_n^{-1}(x-r_n))|\le 5$ grâce à (11.9), donc la série
des dérivées terme à terme
$$
g(x)=\sum_{n\ge n_0}\alpha_n\beta_n^{-1}\,v'\big(\beta_n^{-1}(x-r_n)\big)
$$
converge absolument au point $x$ d'après l'hypothèse 
$\sum\alpha_n\beta_n^{-1}<+\infty$.
Choisissons un point $x+h\in\bR$ et, pour $n\ge N(x)$, distinguons
suivant que $h\ge\beta_n/2$ ou $h<\beta_n/2$. Si $h\ge \beta_n/2$,
alors 
$$
\bigg|{1\over h}\Big(v\big(\beta_n^{-1}(x+h-r_n)\big)-
v\big(\beta_n^{-1}(x-r_n)\big)\Big)\bigg|\le {2\over |h|}\le 4\beta_n^{-1}.
$$
Si au contraire $h<\beta_n/2$, alors 
comme $x\notin{}]r_n-\beta_n,r_n+\beta_n[$, on voit que
$[x,x+h]$ est contenu dans $\complement\;{}
]r_n-\beta_n/2,r_n+\beta_n/2[$, 
et la dérivée de $t\mapsto v(\beta_n^{-1}(t-r_n))$ y est majorée
par~$20\beta_n^{-1}$ grâce à (11.9). On a donc cette fois
$$
\bigg|{1\over h}\Big(v\big(\beta_n^{-1}(x+h-r_n)\big)-
v\big(\beta_n^{-1}(x-r_n)\big)\Big)\bigg|\le 20\beta_n^{-1}.
$$
La contribution des taux d'accroissement des termes d'indice $n\ge N(x)$
dans la série définissant $f$ est donc majorée par 
$20\sum_{n\ge N(x)}\alpha_n\beta_n^{-1}$ tandis que celle des dérivées
$v'(\beta_n^{-1}(x-r_n))$ d'indice $n\ge N(x)$ dans la série $g(x)$
est majorée par $5\sum_{n\ge N(x)}\alpha_n\beta_n^{-1}$.
On peut toujours choisir $N(x)$ assez grand pour que
$\sum_{n\ge N(x)}\alpha_n\beta_n^{-1}\le\varepsilon$. On voit alors
que la différence
$$
{f(x+h)-f(x)\over h}-g(x)
$$
diffère de la somme finie 
$$
\sum_{n_0\le n<N(x)}
\alpha_n{1\over h}\Big(v\big(\beta_n^{-1}(x+h-r_n)\big)-
v\big(\beta_n^{-1}(x-r_n)\big)\Big)-
\alpha_n\beta_n^{-1}\,v'\big(\beta_n^{-1}(x-r_n)\big)
$$
d'au plus $25\varepsilon$. Comme $v$ est partout dérivable, cette somme
finie tend vers $0$ quand $h$ tend vers $0$. On en conclut que $f'(x)=g(x)$
pour $x\in\bR\ssm E$.
\medskip

(c) {\it Non intégrabilité de $f'$ au sens de Lebesgue.} Pour simplifier
les notations, posons
$$
v_n(x)=v\big(\beta_n^{-1}(x-r_n)\big).
$$
On considère l'intégrale de $|f'|$ sur l'ensemble compact
$$
K=[r_p-\beta_p,r_p+\beta_p]\ssm\bigcup_{n>p}{}]r_n-\beta_n,r_n+\beta_n[.
$$
Comme $f'(x)=g(x)=\sum\alpha_nv'_n(x)$ presque partout,
nous avons
$$
\int_K|f'(x)|\,dx\ge \int_K\alpha_p|v'_p(x)|\,dx-\sum_{n\ne p}~
\int_K\alpha_n|v'_n(x)|\,dx.\leqno(11.10)
$$
L'hypothèse (d) entraîne $\beta_{n+1}\ll\alpha_n\beta_n^2\ll
{1\over 2}\beta_n$ pour $n$ assez grand, donc la suite $(\beta_n)$ 
est décroissante à partir d'un certain rang et à décroissance
au moins exponentiellement rapide. Compte tenu de l'hypothèse 
\hbox{$\beta_p\le{1\over 2}\min_{n<p}|r_n-r_p|$}, 
nous voyons que $K$ est disjoint de l'intervalle
$]r_n-\beta_p,r_n+\beta_p[$, $n<p$. Or la majoration $|v'(x)|\le 5/x^2$
implique \hbox{$\int_{[\gamma,+\infty[}|v'(x)|\,dx\le 5\gamma^{-1}$}
pour tout $\gamma>0$, donc 
$$
\int_{|x-r_n|\ge\gamma}\!\!|v_n'(x)|\,dx=
\int_{|x|\ge\gamma}\!\!\beta_n^{-1}|v'(\beta_n^{-1}x)|\,dx=
\int_{|x|\ge\gamma/\beta_n}\!\!|v'(x)|\,dx
\le 10\,\beta_n/\gamma.
$$
Cette dernière majoration appliquée à $\gamma=\beta_p$ pour $n<p$ 
(resp.\ $\gamma=\beta_n$ pour $n>p$) donne
$$
\int_K\alpha_n|v'_n(x)|\,dx\le 
\cases{
10\,\alpha_n\beta_n/\beta_p& pour $n<p$,\cr
10\,\alpha_n& pour $n>p$.\cr}\leqno(11.11)
$$
Or, en posant $\gamma=\sum_{n>p}\beta_n\le 2\beta_{p+1}$ et en faisant le
changement de variable $t=\beta_p^{-1}(x-r_p)$, on voit que
$$
\int_K|v'_p(x)|\,dx = \int_{[-1,1]\ssm E}|v'(t)|\,dt
$$
où $E$ est une réunion d'intervalles de mesure${}\le 2\gamma/\beta_p$.
Comme
\hbox{$\int_{\delta}^1|v'(t)|\,dt\ge c\delta^{-1}$} pour tout $\delta\le 1/2$ 
et pour une certaine constante $c>0$, on peut utiliser
le fait que $[-1,1]\supset[-1,-\lambda\gamma/\beta_p]\cup
[\lambda\gamma/\beta_p,1]$, la parité de $v'$, la majoration
$|v'(t)|\le 5/t^2$ et la décroissance de $t\mapsto 5/t^2$ pour en déduire
$$
\int_K|v'_p(x)|\,dx\ge 
2\int_{\lambda\gamma/\beta_p}^1|v'(t)|\,dt-
\int_{\lambda\gamma/\beta_p}^{(\lambda+2)\gamma/\beta_p}{5\over t^2}\,dt
\ge {2c\beta_p\over\lambda\gamma}-
{10\over\lambda(\lambda+2)}{\beta_p\over\gamma}
$$
pour tout $\lambda>0$ et tout $p\ge p_0(\lambda)$ assez grand. En choisissant
$\lambda$ assez grand pour que $10/(\lambda+2)\le c$, on obtient
$$
\int_K|v'_p(x)|\,dx\ge {c\over\lambda}{\beta_p\over \gamma}\ge 
c_1{\beta_p\over \beta_{p+1}}
\leqno(11.12)
$$
avec $c_1=c/2\lambda$. En combinant (11.10), (11.11), (11.12) il vient
$$
\int_K|f'(x)|\,dx\ge 
c_1{\alpha_p\beta_p\over \beta_{p+1}}-10\sum_{n<p}{\alpha_n\beta_n\over\beta_p}
-10\sum_{n>p}\alpha_n
\ge c_1{\alpha_p\beta_p\over \beta_{p+1}}-{c_2\over\beta_p}-c_3
\ge {c_1\over 2}{\alpha_p\beta_p\over \beta_{p+1}}
$$
pour $p$ assez grand, sous l'hypothèse
$\displaystyle\lim {\alpha_p\beta_p^2\over \beta_{p+1}}=+\infty$. Ceci
entraîne en particulier que
$$
\int_{[r_p-\beta_p,r_p+\beta_p]}|f'(x)|\,dx\ge 
{c_1\over 2}{\alpha_p\beta_p\over \beta_{p+1}}\to +\infty.
$$
Grâce à la densité de la suite $(r_p)$ et au fait que $\beta_p \to 0$, 
on en déduit que $|f'|$ ne peut-être intégrable au sens de Lebesgue sur
aucun intervalle de~$\bR$.\qed


\chapterjump

\chapterrunning{IV.}
\phantom{$\ $}
\medskip
\centerline{\fourteenbf Chapitre IV}
\bigskip
\centerline{\fourteenbf Compléments historiques}
\vskip2cm

Ces compléments historiques ont été compilés et rédigés par 
Bernard Ycart à l'intention des étudiants de L1 de Grenoble (cours
en ligne).
\bigskip

\section{1. Archimède et la quadrature de la parabole}

Voici une traduction de la préface d'un texte 
d'Archi\-mède (287--212 av.\ JC), à propos de l'aire d'un arc de parabole.
\vskip 2mm
{\strut}«\?Archimède, à Dositheus, salut.
\vskip 2mm
Quand j'ai appris que Conon, qui était mon ami, était mort, mais
que vous connaissiez Conon, et étiez également versé en géométrie,
tandis que je pleurais la perte non seulement d'un ami, mais aussi
d'un admirable mathématicien, je me fixai la tâche de vous
communiquer, comme j'avais l'intention de le faire pour Conon, un
certain théorème géométrique qui n'avait pas été
cherché avant, mais a maintenant été cherché par moi, et que
j'ai découvert par des moyens mécaniques, et ensuite montré par
des moyens géométriques. Certains des géomètres anciens ont
essayé de montrer qu'il est possible de trouver une surface
carrée égale à un cercle donné, et à un arc donné d'un
cercle~; et après cela, ils ont tenté de calculer la
surface bornée par une section de cône [ellipse] et une ligne
droite, en supposant des lemmes si peu aisés à concevoir, qu'il
fut reconnu par la plupart que le problème n'était pas
résolu. Mais à ma connaissance, aucun de mes prédécesseurs n'a
tenté de calculer la surface de l'arc borné par une ligne
droite et la section à angle droit d'un cône [parabole],
problème dont j'ai découvert la solution. Car il est montré ici
que tout arc borné par une ligne droite et la section à angle
droit d'un cône est les quatre tiers du triangle qui a la même base
et la même hauteur que l'arc. Pour la démonstration de cette
propriété, le lemme suivant est supposé~:  l'excès par lequel la
plus grande de deux aires inégales excède la plus petite peut, si
on l'ajoute à lui-même, être rendu plus grand que toute surface
finie. Les géomètres anciens ont aussi utilisé ce lemme~; car
c'est en utilisant ce même lemme qu'ils ont montré que les cercles
sont entre eux dans le même rapport que le carré 
de leurs diamètres, que les
sphères sont entre elles dans le même rapport que le cube de leurs
diamètres, et de plus que toute pyramide est le tiers du prisme qui
a la même base que la pyramide et la même hauteur~; aussi, que
chaque cône est le tiers du cylindre ayant la même base que le cône
et même hauteur fut prouvé en supposant un lemme similaire à
celui cité plus haut. Donc, comme mon travail maintenant publié a
satisfait le même test que les propositions citées, j'ai
rédigé la démonstration, et je vous l'envoie, telle qu'elle a
été trouvée par le moyen de la mécanique, et ensuite aussi
comme elle est prouvée par la géométrie.\?»
\vskip 2mm\noindent
En termes modernes, le résultat démontré par Archimède est le
suivant (voir Fig.~25).

\InsertPSFile 20 70 45 45 {archimede.eps}
\EndFig
{\leftskip=1cm\rightskip=1cm
{
{\bf Fig.~25.} {\it Théorème d'Archimède.} La surface d'un arc de 
parabole est égale aux quatre tiers du triangle inscrit.\bigskip}
}

{\bf (1.1) Proposition.} {\it
Considérons la courbe d'équation $y=x^2$. Soient $A$ et $B$ deux
points de cette courbe. Soit $C$ le point tel que la tangente en ce
point soit parallèle à la droite passant par $A$ et $B$. Alors la
surface délimitée par la courbe et le segment $[A,B]$ est égale
à la surface du triangle $ABC$, multipliée par $4/3$.}
\medskip

Avec la possibilité de calculer l'aire contenue sous une courbe
comme une intégrale, le problème est relativement facile. Nous
laissons au lecteur les calculs qui montrent que si $x_A$ est
l'abscisse du point $A$ et $x_B$ l'abscisse du point $B$, alors le
point $C$ a pour abscisse $(x_A+x_B)/2$,  la surface de
l'arc de parabole est $(x_B-x_A)^3/6$ et celle du triangle $ABC$ est 
$(x_B-x_A)^3/8$. 
\vskip 1mm
Mais Archimède ne connaissait pas les intégrales,
pas même les fonctions. Remarquez qu'il n'exprime pas l'aire de
l'arc de parabole comme un nombre, fonction de $x_A$ et $x_B$, comme
nous le faisons~: son théorème énonce un 
rapport de surfaces. C'est aussi ainsi
qu'il rappelle dans son introduction les résultats d'aires et de
volumes connus avant lui.
\vskip 1mm
Les arguments de mécanique auxquels Archimède fait référence sont
des calculs de longueurs de leviers qu'il imagine pour
équilibrer deux surfaces différentes («\?donnez-moi un point d'appui
et je soulèverai le monde\?»). Son découpage de la surface à
calculer en surfaces approchées de plus en plus petites est assez
remarquable. Il faudra attendre une dizaine de siècles 
avant qu'on fasse mieux. 
\bigskip

\section{2. La famille ibn Qurra.}

L'idée de calculer une aire ou un volume en les découpant en petits
morceaux (méthode d'exhaustion) était présente, 
bien avant Archimède, chez les mathématiciens grecs du cinquième
siècle avant notre ère. Elle fut reprise et raffinée, tout au long
du moyen-âge par les mathématiciens arabes~; parmi eux, la famille
des ibn Qurra. 

Abul Hassan Thabit ibn Qurra ibn Marwan al-Sabi al-Harrani (836-901)
était le père de Sinan ibn Thabit ibn Qurra (880-843), 
un médecin lui-même père de Ibrahim ibn Sinan ibn Thabit 
ibn Qurra (908-946), mathématicien et astronome comme son grand-père.

Les calculs de surface de Thabit Ibn Qurra étaient basés sur un 
encadrement par des sommes de rectangles majorantes et minorantes. 
A l'occasion de la quadrature de la parabole, il fut le premier à
avoir l'idée de diviser l'intervalle d'intégration en segments
inégaux.
Ce que son petit-fils Ibrahim dit dans son «\?traité sur 
la quadrature de la parabole\?»,
donne une bonne idée de l'intérêt suscité par les problèmes
de quadrature, et de la compétition entre les mathématiciens de ce
temps.

\strut«\?J'ai composé un travail sur la mesure de la parabole, dans un
traité séparé. Mon grand-père avait résolu la mesure de la
parabole, mais un géomètre m'a appris que al-Mahani avait une solution
de ce problème, qu'il m'a communiquée, qui est plus facile que
la solution de mon grand-père, et personne parmi nous n'avait une
solution meilleure que celle-là. Mon grand-père avait résolu le
problème en 20 propositions, il utilisait de nombreux lemmes
préliminaires parmi ces propositions, et il démontrait la
quadrature de la parabole par la méthode de contradiction. Al-Mahani
utilisait aussi des lemmes sur les nombres pour sa démonstration, et
ensuite il prouvait le résultat par la méthode de contradiction en
cinq ou six propositions, de manière longue. Alors je l'ai
démontré en trois propositions géométriques, sans théorème
préliminaire sur les nombres. J'ai démontré la mesure de la
parabole elle-même par la méthode de la preuve directe, et je n'ai
pas eu besoin de la méthode de contradiction.\?»
\vskip 2mm
La méthode d'Ibrahim était effectivement plus simple que celles de
tous ses prédé\-cesseurs, et elle ne sera surpassée 
qu'après la découverte du calcul intégral, par 
Newton et Leibniz, au 17ème siècle.
\bigskip

\section{3. Calcul numérique des intégrales}

Comment fait-on pour calculer numériquement une intégrale sur 
ordinateur~? Deux cas se présentent, selon que l'on ne connaît
que certaines valeurs de la fonction (typiquement, 
par une table de données expérimentales), ou bien que l'on peut
l'évaluer en n'importe quel point. Comme nous allons le voir, la
deuxième situation est beaucoup plus favorable.
\vskip 2mm
Supposons que l'on dispose de $n+1$ abscisses $x_0,\ldots,x_n$ et de $n+1$
ordonnées $y_0,\ldots,y_n$. L'idée la plus naïve est de
calculer la somme des aires de rectangles basés sur les intervalles
$[x_i,x_{i+1}]$, et de hauteur $y_i$ ou bien $y_{i+1}$~: ce sont les
{\it méthodes des rectangles}, à gauche, ou à droite.
$$
R_g = \sum_{j=0}^{n-1}y_i(x_{i+1}-x_i)
\quad\hbox{et}\quad 
R_d = \sum_{j=0}^{n-1}y_{i+1}(x_{i+1}-x_i)
$$
Si on ne sait absolument rien de la fonction à intégrer, il n'y a
pas de raison d'aller plus loin. Mais si on imagine un modèle, dans
lequel les ordonnées $y_i$ sont les évaluations en $x_i$ d'une
fonction continue $f$, alors on obtient une meilleure précision par
la {\it méthode des trapèzes}, qui consiste simplement à prendre
la demi-somme de $R_g$ et $R_d$.
$$
T = {1\over 2}\sum_{j=0}^{n-1}(y_i+y_{i+1})(x_{i+1}-x_i)
$$ 
Si on imagine un modèle où la fonction à intégrer $f$ est
encore plus lisse, on gagnera en l'interpolant par une parabole sur
des triplets de points successifs. C'est la {\it méthode de Simpson}.

Pour donner une idée de la précision atteinte, supposons que nous
disposions d'une table de $101$ valeurs régulièrement espacées de la
fonction sinus sur l'intervalle $[0,\pi/2]$. L'intégrale de
$\sin(x)$ sur $[0,\pi/2]$ vaut $1$. Voici ce que donnent la méthode
des rectangles à droite et à gauche, la méthode des trapèzes,
et la méthode de Simpson.
$$
R_g=0.9921255\;,\quad
R_d=1.0078334\;,\quad
T=0.9999794\;,\quad
S=1.0000000003
$$
\vskip 2mm
Quand une fonction est donnée par une expression qui permet de
la calculer en n'im\-porte quel point, il serait particulièrement
inefficace de l'évaluer en $101$ points réguliè\-rement espacés,
pour se ramener au cas précédent. 
On utilise plutôt les {\it méthodes de
quadrature de Gauss}. Voici comment fonctionne la plus simple, celle de
Gauss-Legendre. Soit une fonction $f$, à intégrer sur l'intervalle
$[a,b]$. Quitte à effectuer un changement de variable affine, on
peut se ramener au cas où $a=-1$ et $b=1$. Les points auxquels on
doit évaluer la fonction sont les racines des {\it polynômes de
Legendre}. On peut définir ces polynômes 
par récurrence, par une équation différentielle, ou bien comme la
dérivée $n$-ième d'un polynôme de degré $2n$.
$$
P_n(x)={1\over 2^n(n!)}\Big((x^2-1)^n\Big)^{(n)}
$$
Les racines de $P_n$ sont dans l'intervalle $[-1,1]$, et réparties de
façon symétrique par rapport à l'origine. Comme $P_n$ est de
degré $n$, il a $n$ racines~: notons-les $x_1,\ldots,x_n$. A la racine
$x_i$, on associe le «\?poids\?» $\omega_i$~:
$$
\omega_i = {2\over (1-x_i)^2(P'_n(x_i))^2}
$$ 
On calcule ensuite la somme~:
$$
L_n = \sum_{i=1}^n \omega_i f(x_i)
$$
Les racines des polynômes de Legendre, ainsi que les poids qui leur
sont associés sont connus depuis longtemps, et
inclus dans les bibliothèques de codes des langages de calcul
scientifique~: le calcul de $L_n$ est donc extrêmement rapide. Vous
apprendrez plus tard les raisons mathématiques 
pour lesquelles ce calcul donne en général une valeur très proche
de l'intégrale de $f$. Les résultats sont spectaculaires. Voici
pour la même fonction sinus entre $0$ et $\pi/2$, ce que donne la
méthode de Gauss-Legendre pour $n\leq 5$.  
$$
L_2-1=-1.5~10^{-3}\;,\quad
L_3-1=8.1~10^{-6}\;,\quad
L_4-1=-2.3~10^{-8}\;,\quad
L_5-1=3.9~10^{-11}
$$
Ainsi, en évaluant la fonction sinus en $5$ points seulement, on
calcule son intégrale avec une précision de l'ordre de
$10^{-11}$~: impressionnant non~?
\bigskip

\section{4. Les différentes intégrales.}

L'idée qu'une intégrale pouvait être calculée comme une somme
de petits rectangles était depuis longtemps bien 
admise. Voici ce qu'en dit Pascal (1623-1662).
\vskip 2mm

\strut
«\?On n'entend autre chose par somme des ordonnées d'un cercle sinon la
somme d'un nombre indéfini de rectangles faits de chaque ordonnée
avec chacune des petites portions égales du diamètre, dont la somme
$[\ldots]$ ne diffère de l'espace d'un demi-cercle que d'une quantité
moindre qu'aucune autre donnée.\?»
\vskip 2mm
Il faudra attendre encore deux siècles après Pascal, avant qu'on ne
donne un sens rigoureux à «\?nombre indéfini de rectangles\?» et
«\?moindre qu'aucune autre donnée\?»~: celui d'une limite pour des
subdivisions dont le pas tend vers $0$.

Vers 1670, Newton et Leibniz firent simultanément la découverte
fondamentale, que
l'intégration et la dérivation était des opérations inverses
l'une de l'autre. Pour calculer une aire, il suffisait désormais de
connaître une primitive de la fonction qui la délimitait. Ceci
fit quelque peu passer au second plan la méthode d'intégration des
grecs et des arabes, consistant à découper l'aire à calculer en
petits rectangles. Mais jusqu'au 19ème siècle,
personne ne s'était posé la question de définir
la convergence d'une somme d'aires de petits rectangles, vers une
intégrale.

En 1823, Cauchy fut le premier à tenter une définition rigoureuse,
pour l'intégrale d'une fonction continue sur un
segment. Malheureusement, la définition de la continuité qu'il
donnait, confondait continuité et continuité uniforme, deux notions
qui ne seront distinguées que bien après lui. Plus grave, Cauchy
énonçait et «\?démontrait\?» un théorème faux, selon 
lequel l'intégrale de la limite d'une suite de fonctions serait 
toujours la limite des intégrales des fonctions de la suite.

Tout le monde était d'accord depuis longtemps 
sur l'intégrale des fonctions en escalier. 
A partir de là, il semblerait qu'il suffise de dire 
qu'une fonction est limite en tout point de fonctions en escalier, 
et de passer à la limite sur les intégrales. 
Ce n'est malheureusement pas si 
simple. L'exemple suivant aidera à comprendre pourquoi.
Pour tout entier $n$, définissons la fonction $f_n$, de $[0,1]$ dans
$\bR$, qui à $x$ associe~:
$$
f_n(x) = \cases{
n&si $x\in[0,1/n]$\cr
0&si $x\in{}]1/n,1]$\cr
}
$$
Pour tout $n$, $f_n$ est une fonction en escalier, dont l'intégrale
vaut $1$. Pourtant, pour tout $x\in ]0,1]$, la suite $f_n(x)$ tend
vers $0$ (elle est nulle à partir d'un certain rang). Or la fonction
nulle est d'intégrale nulle~: n'en déplaise à Cauchy,
l'intégrale de la limite n'est pas toujours la limite des
intégrales~!

En 1854, Riemann proposa un raffinement des définitions de Cauchy,
qu'il rendait rigoureuses, tout en les adaptant à des fonctions qui 
n'étaient plus nécessairement continues. L'idée d'approcher
l'intégrale par une subdivision de l'intervalle d'\'intégration
restait la même. 

En 1902, Lebesgue proposa une nouvelle approche~: au lieu de
subdiviser l'intervalle d'intégration, il subdivisait l'intervalle
des valeurs de la fonction. La théorie de Lebes\-gue, si elle est
plus difficile à comprendre, présente de
nombreux avantages sur celle de Riemann~: les théorèmes de
convergence sont plus puissants, et plus de fonctions peuvent être
intégrées. L'intégrale de Lebesgue est généralement enseignée
en troisième ou quatrième année d'université.

Cependant, la construction de Lebesgue n'était toujours pas
parfaitement satisfaisante. A peu près dix ans après Lebesgue, 
Arnaud Denjoy et Oskar Perron, proposèrent chacun
une variante plus générale, mais
plus compliquée. Il fallut attendre la fin des années cinquante 
pour que Ralph Henstock et Jaroslav Kurzweil se rendent 
compte que non seulement les
intégrales de Denjoy et Perron étaient équivalentes, mais que
l'on pouvait donner de leur théorie une version beaucoup plus simple~:
celle qui a été présentée dans ce cours.
 
Entre temps, bien d'autres mathématiciens ont laissé leur
nom à une définition d'inté\-grale, comme Darboux, Stieltjes,
Daniell, Radon, Itô, etc. 
\bigskip

\section{5. La mésaventure de Chasles}

Michel Chasles (1793-1880) avait des relations~: 
il était titulaire d'une chaire de géométrie 
à la Sorbonne créée tout spécialement pour lui, 
et membre de l'Académie des Sciences. 
Il aimait l'histoire et collectionnait les documents
anciens. Il était aussi d'un patriotisme
fervent$\,\ldots$~ et d'une naïveté désarmante.

Un jour de 1861, il reçut un certain Vrain-Lucas, qui se disait
dépositaire d'un lot de vieux papiers, sur lequel il sollicitait l'avis
éclairé du grand académicien. Celui-ci, émerveillé, reconnut
aussitôt dans les premiers échantillons fournis, un inestimable
trésor pour notre patrimoine national~: des lettres du grand Pascal,
dont certaines établissaient clairement que leur auteur avait
découvert l'attraction universelle avant Newton~: quelle
fierté~! Pendant des années, Chasles acheta tout ce que
Vrain-Lucas pouvait lui fournir~: en tout, pas moins de vingt sept
mille documents, payés cent quarante mille francs, une fortune pour
l'époque. Tant pis si quelques esprits chagrins faisaient remarquer
que dans les lettres de Pascal apparaissaient des données
astronomiques recueillies bien après
sa mort. Tant pis si dans une lettre, Galilée se plaignait de sa vue
qui devenait mauvaise, alors qu'il l'avait perdue depuis quatre ans~:
qu'à cela ne tienne, Chasles exhibait aussitôt d'autres lettres
fournies par Vrain-Lucas, qui comme par hasard
répondaient exactement à ses détracteurs. A ceux qui
s'étonnaient que Jules César, Socrate, Cicéron, Hérode, 
Vercingétorix, aient tous écrit dans le même vieux
français fantaisiste, Vrain-Lucas répondait qu'un savant du temps
de Charlemagne avait rassemblé cette collection de lettres
anciennes, qu'il avait déposé dans une abbaye. Sept siècles plus tard,
Rabelais avait traduit les lettres, et Chasles était l'heureux
acheteur des copies autographes de Rabelais. 

Le procès pour fraude de Vrain-Lucas eut lieu en 1870. Chasles vint
lui-même exposer au tribunal comment il avait enfin découvert 
la supercherie~: il avait fait surveiller Vrain-Lucas qui tardait à
livrer trois mille nouvelles lettres qu'il avait promises (il fallait
bien le temps de les écrire~!). Pendant les huit ans que dura l'affaire,
Chasles n'avait apparemment jamais eu le moindre doute, aveuglé qu'il
était sans doute, par la fierté d'être celui qui conserverait 
à la France ces témoignages inestimables de son passé glorieux. 
Voici un extrait d'une {\it lettre d'Alexandre le Grand à Aristote}
(sic), qui fit éclater de rire l'auditoire du tribunal.

\strut«\?$\ldots$~ Quant à ce que m'avez mandé d'aller
faire un voyage au pays des Gaules, afin d'y apprendre la science des
druides, non seulement vous le permets, mais vous y engage pour le
bien de mon peuple, car vous n'ignorez pas l'estime que je fais
d'icelle nation que je considère comme étant ce qui porte la
lumière dans le monde.\?» 
\chapterjump

\chapterrunning{\ }
\notthispage=0
\section{Références bibliographiques}
\bigskip

{\eightpoint
\input henstock_ref.tex
}

\end

% Local Variables:
% TeX-command-default: "uTeX"
% End:

