非凸函数
出处:按学科分类—自然科学总论 北京出版社《现代科技综述大辞典上》第70页(4794字)
早在20世纪50年代就有了推广凸函数的工作。
W.Fenchel(1953)和H.Nikaidô(1954)引入了拟凸函数的概念。定义在凸集上的实值函数f称为是拟凸的,如果对任意,λ∈(0,1)有
f(λx+(1-λ)y)≤max{f(x)、f(y)}.
对任意实数α∈R,f的水平集定义为
S(f,α)={x∈C|f(x)≤α}.
定义在凸集上的函数f为拟凸函数的充要条件是:对任意α∈R,f的水平集都是凸集。
实际上,具有凸水平集的函数,B.de Finetti于1949年曾研究过,他的结果后来被W.Fenchel推广和校正。
若f在开凸集上可微,则f为拟凸函数的充要条件是:对任意x、y∈C
f(x)≤f(y)=》(x-y)T▽f(y)≤0
60年代.K.∫.Arrow、A.C.Enthoven、∫.A.Ferland、B.Martos、C.Berge和D.G.Luenberger等人在研究拟凸函数的性质、充要条件及其应用方面作了重要工作,M.A.Hanson、B.Martos、S.Karamardian和R.Elkin等人提出并研究了严格拟凸性(显拟凸性)、强拟凸性(无名凸)等。
1965年,O.L.Mangasarian引入伪凸函数的概念,称可微函数f为开凸集上的伪凸函数,如果对任意有
,
若x≠y时,后一不等式是严格不等式,则称f是严格伪凸函数。Tuy在1964年也提出了类似的概念,称作半凸函数。
可微凸函数是伪凸的,伪凸函数是拟凸和严格拟凸的。
O.L.Mangasarian 1965年证明:若f是开凸集上的伪凸函数,则x*∈C是f在C上的整体极小点当且仅当▽f(x*)=0.
1967年,J.Ponstein研究了凸性、拟凸性、伪凸性等7种凸性之间的关系。
关于拟凸性、伪凸性等广义凸性的性质、特征、判别准则以及在数学规划中的应用的研究在70年代和80年代一直很活跃,W.E.Diewert、M.Avriel、I.Zang、J.P.Crouzeix、J.A.Ferland、R.W.Cottle和S.Schaible等人获得了许多很有意义的新成果。
伪凸性和拟凸性等广义凸性早已成为最优化理论的重要经典概念,但直到目前,有关它们的进一步推广及应用研究仍很活跃,并有了新的突破。
1980年,M.A.Hanson提出了全新的广义凸(或称为非凸)概念,设f:Rn→R可微
(1)若存在向量值函数η:Rn×Rn→Rn使
f(x)f(y)≥η(x,y)T▽f(y),
则称f是不变凸的(invex);
(2)若存在向量值函数η:Rn×Rn→Rn使,
则称f是拟不变凸的(quasi-invex);
(3)若存在向量值函数η:Rn×Rn→Rn使,
则称f是伪不变凸的(pseudo-invex)。
Hansen当时称这3类函数分别为第Ⅰ、第Ⅱ、第Ⅲ类函数,不变凸、拟不变凸、伪不变凸是B.D.Craven 1981年采用的名称,invex由invariant convex缩写而来因为Craven发现性质(1)在双射坐标变换下是不变的。
Hanson 1980年证明;如果非线性规划的目标函数和每一约束函数关于同一η是不变凸的,那么弱对偶性和Kuhn-Tucker条件的充分性照样成立。类似地,将拟凸性、伪凸性分别减弱为拟不变凸、伪不变凸,相应的结论仍然成立。
1985年B.D.Craven和B.M.Glover证明:可微函数是不变凸的当且仅当它的任意驻点都是整体极小点。由不变凸性的这一特征可见,伪凸函数或伪不变凸函数都是不变凸函数,而不变凸函数显然也是伪不变凸函数,于是不变凸和伪不变凸一致。
不过一个函数作为不变凸函数时所对应的η一般与其作为伪不变凸时所对应的η是不同的。
不变凸性是对凸性的较大突破,它在数学规划最优解的充分性、鞍点等价性、对偶性和Slater约束规格等问题中,可以代替常用的凸性,拟不变凸性和伪不变凸性也有类似作用,从而使许多已有的结果得以大大推广。Hanson的论文出现之后,研究、运用和推广Hanson工作的热潮迅速兴起,涌现了大量新成果。近年来,随着非光滑分析的发展,利用(广义)方向导数、广义梯度等工具将不变凸性、拟不变凸性和伪不变凸性向非光滑函数推广的工作增多。在10余年的研究热潮中,M.A.Hanson、B.D.Craven、B.Mond、A.Ben-Isreal、B.M.Glover、R.R.Egudo、T.Weir、V.∫eyakumar、R.N.Kaul、S.Kaur、D.H.Martin、T.W.Reiland、林锉云、刘三阳、杨新民等人为推广和发展Hanson的工作做了大量工作。
有必要指出的是,Hanson和Mond 1982年曾试图用下述方式进一步推广凸性定义,设可微,称f在C上是F→凸的,如果对任意x、y∈C,存在次线性泛函Fx、y:Rn→R使f(x)-f(y)≥Fx,y[▽f(y)],而如果有
则称f在C上是F-伪凸的。Hanson和Mond当时以为这种广义凸性比不变凸、伪不变凸应用更广,此后,一些学者还利用这种广义凸性“推广”数学规划中的若干已有成果。遗憾的是,这种研究并未达到预期目的,Craven和Glover 1985年指出:F-凸和F-伪凸实际上也是不变凸的,这是因为由定义易知,F-凸和F-伪凸函数的驻点也是最小值点,而这正是不变凸函数的特征。
1953年,K.Fan在推广极小极大定理时引入了类凸(convexlike)的概念,称在C上是类凸的,如果对任意x、y∈C、λ∈(0,1),存在z=z(x,y,λ)∈C使.
类凸性的条件很弱,从不同于上述广义凸性、非凸性的角度推广了凸性,在Fan的工作之后相当一段时间,未见类凸性的进一步研究和应用。直至1980年,K.H.Elster和R.Nehse讨论了类凸规划的最优性条件,1982年,M.Hayashi和H.Komiya讨论了类凸规划的对偶性,1985年,V.Jeyakumar给出了更一般的ρ-类凸定义,将经典的凸择一定理推广为类凸择一定理,并给出了在数学规划中的应用,1987~1990年,刘三阳讨论了ρ-类凸性在向量极值问题中的应用。
一般的广义凸性或非凸性概念都是从减弱数学规划最优性充分条件的角度提出的,而类凸性则可以改进最优性必要条件。
1983年,J.P.Vial给出了ρ-凸的概念,设是凸集,称f:C→R是ρ凸的,如果存在实数ρ,使对任意,λ∈[0,1]有
f(λx+(1-λ)y)≤λf(x)+(1-λ)f(y)-ρλ(1-λ)‖x-y‖2ρ>0时称f是强凸的,ρ<0时称f是弱凸的,ρ=0时f是凸的。
强凸和弱凸并非新概念,早在1963年,E.S.Levitin和B.T.Poljak在研究约束极小化方法时就提出了强凸概念。70年代也有一些学者研究过强凸性,不过J.M.Ortega等人称之为一致凸性(B.T.Poljak和R.Elkin分别在1966年和1968年还讨论过一致拟凸性),R.T.Rockafellar称之为模是的强凸函数。J.P.Vial等人在70年代也研究过弱凸性。J.P.Vial在1982年和1983年对强(弱)凸函数进行了深入研究,1986年,V.Jeyakumar研究了强(弱)凸函数的次梯度对偶性。
M.Avriel等人在70年代还提出并研究过弧式凸函数和r-凸函数。
总之总结、整理、研究、改进、推广和应用非凸函数的工作仍是一项很有意义和潜力的课题,并将与非光滑分析的研究更密切地结合在一起。对非凸函数建立类似于凸函数和凸分析的系统理论。形成非凸分析的完整框架,将是一项具有深远影响的工作,而恰当建立实用有效的非凸函数概念是这一工作的基础,也是有待进一步探讨的重要问题。
。【参考文献】:1 Mangasarian O L. Nonlinear Programming. New York: McGraw-Hill 1969
2 Avriel M. ,Nonlinear programming:analysis and methods. Prentice-Hall, Inc, 1976
3 Hanson M A. J Math Anal,Appl, 1981,80:545~ 550
4 Vial J P. Math Oper Res, 1983,8(2):231~259
5 Jeyakumar V. Convexlike alternative theorems and mathe-matical programming, Optimization, 1985,16:643~652
6 Craven B D,Glover B M. J. Austral. Math. Soc. (Ser. A). 1985,39:1~20
7 Ben -Isreal A,Mond B. J Austral Math Soc (Ser. B),1986,28:1~9
8 Reiland T W. Bull Austral Math Soc,1990,42:437~446。
9 刘三阳.西安电子科技大学学报,1990,17(1)∶63~69
10 刘三阳.应用数学,1991,4(1)∶58~63
(西安电子科技大学博士生导师刘三阳撰;游兆永审)