W3CHINA.ORG��ҳ/�ĵ�����/XML 1.1

������Ϣ����� W3CHINA.ORG������

A website dedicated to promoting the widespread deployment of W3C technologies.

A website designed to propagate information on the future of the Web.

A website ideally suited for discussions and the exchange of relevant information.

���ģ�

XML 1.1��ѡ�Ƽ���׼Unicode�������İ���http://xml1p1.w3china.org��

ԭ����

XML 1.1 Candidate Recommendation��http://www.w3.org/TR/2002/CR-xml11-20021015��

˵����

l         ���ĵ��Ǹ���2002��10��15�շ�����XML 1.1��ѡ�Ƽ���׼����ġ�

l          ���ĵ���Ӣ�İ���Ψһ����ʽ�汾��

l          ��Ȼ������Ϊ����֮��ȷ����Ŭ��������֮����������ڡ���ӭ����ָ����

l          ��ע�������Ƿ���ʽ�ģ����������߸��˹۵㡣

l          ����Ȩ����λ�ڣ�

���ߣ�

�캭��Collin Hsu��

ʱ�䣺

�״η�����2003��10��28��/��������2003��10��28��

����չ������ԣ�XML�� 1.1

W3C ��ѡ�Ƽ���׼ 2002��10��15��

��ǰ�汾��

http://www.w3.org/TR/2002/CR-xml11-20021015

���°汾��

http://www.w3.org/TR/xml11/

��һ�汾��

http://www.w3.org/TR/2002/WD-xml11-20020425/

���ߣ�

John Cowan, Reuters < jcowan@reutershealth.com >

 


ժҪ

���ĵ���XML Core Working Group�����Ĺ����ɹ���������XML Blueberry Requirements�еĶ����XML 1.1������������XML 1.1����ȥ��˵��XML Blueberry�����ĵ�����������ȡ��XML 1.0�Ƽ���׼[XML1.0]����һϵ�иĶ��ķ�ʽ�����ĵ���ƪ�±�Ŷ�Ӧ��������XML 1.0�Ƽ���׼�е�ƪ�±�š�������ЩXML 1.0�Ƽ���׼���С������ĵ���û�е�ƪ�£���ʾ����û�б��Ķ���

���ĵ���״̬

��һ�����������ĵ��ڷ���ʱ��״̬�����ĵ����ܻᱻ�����ĵ���������ĵ����е�����״̬��W3Cά����

���ĵ���XML 1.1��W3C��ѡ�Ƽ���׼��W3C Candidate Recommendation����W3C���������棨technical report��[��ע//�������漴W3C�ٷ��������ĵ�]��״̬��Ϊ��ѡ�Ƽ���׼����ζ�Ÿ��ĵ�����Ϊ���ȶ��ģ���������������ȥʵ���������ں�ѡ�Ƽ���׼״̬����������μ�Process Document��5.3.2����

һ��XML Core Working Group������XML Activity��һ���֣��μ�ժҪ��֤ʵ���ٴ����������Ի�������ʵ�֣����ǽ�������W3C Director�����淶����Ϊ�����Ƽ���׼��Proposed Recommendation����������ʵ�ֱ������ɲ�ͬ����֯ʵ�ֵġ�

��ǰ��ʵ�ֱ�����¼�˵�ĿǰΪֹ�����Ѿ��յ���ʵ�ַ���ķ�����

״̬Ϊ��ѡ�Ƽ���׼���ĵ����������ѱ�W3C��Ա�Ͽɡ�����һ���ݰ�����ʱ���ܱ������ĵ����¡��滻�����ϡ������ñ��ĵ�ʱӦע����work in process����

���ĵ��Լ����ĺ����ĵ������ö�XML 1.0�Ƽ���׼�����޸ĵ���ʽ����д���Ա��ڱ༭�ͼ�顣���յ�XML 1.1�Ƽ���׼��XML 1.1 Recommendation�����ܲ�ȡ��XML 1.0�Ƽ���׼���б�Ҫ�޸ĵ���ʽ���г�����

�뱾�ĵ��йص�֪ʶ��Ȩ����ļ�¼������Working Group��s public IPR disclosureҳ���ҵ���

������ȷ����Ա��ĵ��������ۡ���ѡ�Ƽ���׼�ĸ�������UTCʱ��2003��2��14��23��59�ֽ������뽫���۷�����www-xml-blueberry-comments@w3.org�������ṩ��������ѡ��ʽ�����������Լ��ظ����Դ�������ַ��ã�http://lists.w3.org/Archives/Public/www-xml-blueberry-comments/��

���ĵ��ķ������������ѱ�W3C��Ա�Ͽɡ�����һ���ݰ�����ʱ���ܱ������ĵ����¡��滻�����ϡ������ñ��ĵ�ʱӦע����work in process����W3C�Ƽ���׼�����������ĵ���technical document���������б��ɴ�������ַ��ã�http://www.w3.org/TR��


Ŀ¼

����

2.2 �ַ�

2.3 ��ͨ���﷨����Ԫ��

2.8 ���Ժ��ĵ���������

2.11 �����

2.13 W3C�淶�����[��]

4.1 �ַ����ú�ʵ������

4.3.4 ʵ���еİ汾��Ϣ[��]

��¼A �ο�����

��¼B �ַ���[�����]


����

W3C��XML 1.0�Ƽ���׼���������1998�ꡣ����XML 1.0���ڶ��棩�ķ������������࿱�󣬵�XML 1.0�ڹ���ʲô�������ģ�well-formed��XML�����ԣ����⣩���ֲ��䡣��һ�ȶ��Ի������Ǽ�Ϊ���õġ�Ȼ��Unicode��׼��ΪXML 1.0���������ַ��淶��û�б��ֲ��䣬���Ѿ���2.0����������3.1���������ߡ�������Unicode 2.0��û�е��ַ������Ѿ���ʹ����XML 1.0���ַ����ݣ�character data�����ˡ�Ȼ���������Dz�����������XML���ƣ�XML name��������Ԫ������������������ö������ֵ��PIĿ��ȵȣ��еġ����⣬��Щ��Ӧ������XML�����г��ֵ��ַ����������������Unicode 2.0��һ�µ�ԭ��û�б�������

��XML 1.0֮�󣬹������ƣ�name�������忴���������ı䡣Ȼ��XML 1.0�����ƣ�name���ṩ����һ���ϸ�Ķ��壺�����κβ��������ģ����ǽ�ֹ�ġ�XML 1.1������ȴ��������Ƶģ��κβ�����ֹ�ģ�����ij���ض�ԭ�򣩣����������ġ����ǵ�Unicode�汾�ķ�չ��Խ��3.1�棬Ϊ�����XML���и���һ���ĸĶ���XML 1.1�������������ַ���������Щ��δ��ָ���ģ��������г��֡�

���⣬XML 1.0��ͼ��Ӧ�����ִ�����ϵͳ����β��������convention������ȴû�п���IBM����IBM���ݣ����ͻ���mainframe������β����������ˣ����ݱ��ع��򣬴��ͻ��ϵ�XML�ĵ����Ǽ򵥵��ı��ļ������ͻ����ɵ�XML 1.0�ĵ�����Υ�����ص���β�������򣬻����ڽ���������ǰʹ�����������ת�����̡�������Ҫ�ڴ��ͻ��ͷǴ��ͻ�����ͬ�ڴ�һ���������Ƶ���һ���������乲��ʱ������ֱ�ӵĻ������Ե���Ϊ��Ҫ�����XML 1.1����β�ַ��б���������һ��NEL(#x85)�ַ��������걸�Կ��ǣ�XML 1.1Ҳ֧��Unicode���зָ���#x2028��

���ΪXML�ĵ��е�����Unicode�ַ�����һ����׼�ı�ʾ��һ��Ӧ���ӵ�������ˣ�XML 1.1����ʹ���ַ����ã�character references�������ô�#x1��#x1F�Ŀ����ַ������д󲿱���XML 1.0���DZ���ֹ�ģ������ڽ�׳�ԣ�robustness�����ǣ���Щ�ַ��Բ���ֱ�����ĵ���ʹ�á�Ϊ������ַ�����ʶ��Ľ�׳�ԣ�ԭ����XML 1.0�ĵ����������ɳ��ֵĸ��ӿ����ַ�����#x7F��#x9F�����ڱ������ַ����õ���ʽ���֣��հ��ַ���Ȼ�dz���ģ�������������������Ӱ�첢��������APIs����DZ�ڵ����⣬#x0���DZ���ֹ�ģ�������ֱ��ʹ�ã�Ҳ�������ַ����õ���ʽʹ�ã���

û��ΪXML 1.0����һ�鿱�󣬶��Ǵ���һ���°汾��XML������Ϊ��Щ�Ķ�Ӱ���������ģ�well-formed��XML�ĵ�������塣XML 1.0��������������ܾ���ЩXML�����к������ַ���ʹ���µ���β��������ͶԿ����ַ������ַ����õ��ĵ�����XML 1.0�ĵ���XML 1.1�ĵ������ֿ���ͨ���ĵ��ײ�XML������XML declaration���еİ汾����Ϣ���жϡ�

2.2 �ַ���Characters��

������ʽ[2]��Ϊ��

[2]     Char    ::=    #x9 | #xA | #xD | [#x20-#x7E] | #x85 | [#xA0-#xD7FF]
                      | [#xE000-#xFFFD] | [#x10000-#x10FFFF]

 

������ʽ[2]��ע�͸�Ϊ��

�κ�Unicode�ַ�����ȥ�󲿷�ISO�����ַ�����������surrogate blocks��[��ע//��������surrogate blocks��ΪUnicode����������ļ�Ҫ˵����μ�Tim Bray׫д��Unicode Surrogates]��FFFE��FFFF��

2.3 ��ͨ�﷨����Ԫ�أ�Common Syntactic Constructs��

�޸IJ���ʽ[4]���������µIJ���ʽ[4a]:

[4]     NameStartChar := ":" | [A-Z] | "_" | [a-z] |
         [#xC0-#x2FF] | [#x370-#x37D] | [#x37F-#x1FFF] |
         [#x200C-#x200D] | [#x2070-#x218F] | [#x2C00-#x2FEF] |
         [#x3001-#xD7FF] | [#xF900-#xEFFFF]
[4a]    NameChar := NameStartChar | "-" | "." | [0-9] | #xB7 |
      [#x0300-#x036F] | [#x203F-#x2040]
 

������ʽ[5]��Ϊ��

 [5]     Name    ::=   NameStartChar NameChar*
 

�ڲ���ʽ[5]������������������֣�

���ƣ�Name���ĵ�һ���ַ�������һ��NameStartChar�������ַ�������NameChars����һ���Ʊ�֤�����Ʋ�����������ASCII�����ֻ��������ַ���combing characters��[��ע//Unicode�������μ�������]��ͷ�����������ַ��������������г��֣�������Щ����������ܱ������ָ������ַ�������Ŀ����Ϊ��ʹ֮��Ϊ���ݵģ�inclusive�������������ģ�exclusive����������û�б�Unicode�������дϵͳ��writing systems��[��ע//Unicode�������μ�������]Ҳ����XML�����б�ʹ�á��������ƴ�������Ľ��飬��μ���¼B��

�����ĵ�����ʹ������Ȼ��������������ִ���ΪXML���ƣ���������������ʹ�÷����ַ���symbolic characters����հ��ַ���whitespace characters����ע�⣺ð�ţ����������ַ���-������ţ�.�����»��ߣ�_����Բ�㣨��������ȷ�����ġ�

��ֹASCII�����ַ���symbols�����������Լ�һ����Unicode�����ַ���XML�����г��֣���Ϊ����XML�ĵ�����ᄈ��ʹ��XML����ʱ���԰���Щ�ַ���Ϊ�ָ������ַ�#0x037E��ϣ���ַ����ʺţ�����ֹ��������Ϊ���ַ��ڹ淶���󽫳�Ϊ�ֺţ������������ı�ʵ�����õĺ��塣

�Ѳ���ʽ[7]��Ϊ:

 [7]     Nmtoken    ::=   NameChar+
 

2.8 ���Ժ��ĵ�����������Prolog and Document Type Declaration��

�����е���1.0����Ϊ��1.1����

��������������֣�

XML 1.1������ҲӦ���Դ���XML 1.0�ĵ������һ���ĵ��������ģ�well-formed������Ч�ģ�valid��XML 1.0�ĵ������Ҳ�ֱ�Ӱ����κ�[#x7F-#x9F]�е��ַ�����ת���ַ���ʽ���ֵij��⣩����ֻҪ���ĵ���XML�汾�Ÿ�Ϊ��1.1���Ϳ�ʹ֮��Ϊһ�������Ļ���Ч��XML 1.1�ĵ���

2.11 �������End-of-Line Handling��

���ڶ����滻Ϊ�������֣�:

Ϊ�˼�Ӧ�ó��������XML����������Ӧ�ó�����ַ������Ǿ���XML�������ڽ��н���֮ǰ�ѽ������е��ⲿ�ѽ���ʵ�壨external parsed entities���������ĵ�ʵ�壩�е����л��з��淶������һ��������Ĺ淶����ͨ���������ַ�ȫ���滻Ϊ�ַ�#xA��ɵģ�

��         ˫�ַ����� #xD #xA

��         ˫�ַ����� #xD #x85

��         �����ַ�#x85

��         �����ַ�#x2028

��         ����û�б��ַ�#xA���ַ�#x85������ַ�#xD ��

2.13 �淶����飨Normalization Checking��[��]

���е�XML�ѽ���ʵ���������ĵ�ʵ������Ӧ����[Charmod]�еĶ����Լ������XML��ع���ɷ֣�relevant constructs��[��ע//Charmod�е��������μ�������]�IJ��䶨�屻��ȫ�淶����fully normalized��[��ע//CharmodΪ�ı���text��������������εĹ淶������������Ϊ��Unicode�淶����Unicode Normalization����Ƕ��淶����Include Normalization������ȫ�淶����Fully Normalization����]��

��         �����ѽ���ʵ����parsed entities�����滻�ı���replacemane text��

��         ��������������ƥ�����в���ʽ���ı�          

o        CData

o        CharData

o        content

o        Name

o        Nmtoken

Ȼ������ʹ�ĵ�δ����ȫ�淶���������������ġ�XML������Ӧ���û�ѡ���Ƿ�Ҫ��֤���������ĵ���û�д�����ȫ�淶����ʽ��fully normalized form��������Ӧ�ó��򱨸���֤�Ľ��������[Charmod]�еĹ涨��ֻ���������ı����Ѽ����ģ�certified��[��ע//Certified TextΪCharmod�е��������μ�������]������£���Ӧѡ�񲻽�����֤��

����ȫ�淶������֤���루������ǣ�������֤ʵ����Ƕ��淶����include-normalized�����μ�[Charmod]���ģ�Ȼ����֤�������г�����ع���ɷ�û���Թ����ַ���composing character����ͷ�����ַ����ñ�չ��֮�󣩣��μ�[Charmod]��������֤�Ĵ�������non-validating processors���������Ƕ��δ���ⲿʵ��ʱ������ɵķǹ淶����denormalization����

ע�⣺�����ַ���composing characters��[��ע//Charmod�е�����������μ�����]Ϊ���з�0������ࣨnon-zero combining class��[��ע//UnicodeΪÿ�������ָ����һ�����룬�������ָ�������ࡣ��Щ���������ʶ�ã����������κκ��塣]�е��ַ�����������0������ࣨclass-zero���е��ַ���ָ��Щ��ijЩ��׼�ֽ��в���Ϊ���ַ����ַ��������ڹ����ַ������������׼�ַ���base characters��[��ע//Unicode����������μ�����]�ģ���ˣ�������ع���ɷ֣��������ݣ������Թ����ַ���ͷ������ʵ�ʼ���XML�ı���������

���XML����������ȫ�淶������֤��������������ȷ����淶���������ַ�����������Щ�ַ���[Unicode]�汾����ʵ�ָô�����ʱ�����ǵ��Ǹ�Unicode�汾֮�󷢲��ģ�����ô���������ԣ������û���ѡ�񣩺��Կ�������Щ�ַ����µķǹ淶����denormalizations�����⡣�ڿɿ��ԺͰ�ȫ�Լ�Ϊ��Ҫ������£�Ӧ�ó���Ӧѡ�������Щ�ǹ淶����

XML���������������ת��Ϊ��ȫ�淶����ʽ������XML 1.1�����XMLӦ�ó�������������XML 1.0����XML 1.1�ģ�Ӧȷ���������ȫ�淶���ģ��������ڲ��Ĵ�����ʽ������Բ�����ȫ�淶���ġ�

���ڵ���ͼ��ǿ�ҽ���XML������ȷ��XML�ĵ��Ĵ������Ѿ��������ȫ�淶��������XMLӦ�ó���Ϳ��Խ����ַ����Ƚϣ������ص����ַ����Ķ��ֲ�ͬƴд��ʽ������Unicode�����ģ���

4.1 �ַ����ú�ʵ�����ã�Character and Entity References��

��Well-formedness constraint: Legal Character�滻Ϊ����������֣�

���ַ����ã�character reference����ʽ�����õ��ַ�������ϲ���ʽChar��������һ���ڷ�Χ[#x1-#x1F]��[#x7F-#x9F]�ڵ�ISO�����ַ���

4.3.4 ʵ���еİ汾��Ϣ��Version Information in Entities��[��]

ÿ��ʵ�壨�����ĵ�ʵ�壩���Ը��Ա�����ΪXML 1.0��XML 1.1���ĵ�ʵ���еİ汾����ȷ��������XML�ĵ��İ汾��һ��XML 1.1�ĵ����Ե���XML 1.0�ⲿʵ�壬�����Ͳ���Ҫά���ⲿʵ��汾���ظ����ر���DTD�ⲿ�Ӽ�����������������£�XML 1.1�Ĺ���Ӧ���������ĵ���

���һ��ʵ�壨�����ĵ�ʵ�壩û�б����汾�ţ�����Ϊ���İ汾��Ϊ1.0��

��¼A  �ο�����(References)

�������¹淶�Բο����ϣ�

[XML1.0]

Tim Bray, Jean Paoli, C.M. Sperberg-McQueen, Eve Maler (editors), Extensible Markup Language (XML) 1.0 (Second Edition), 6 October 2000.  (See http://www.w3.org/TR/REC-xml .)

[Charmod]

Martin J. D��rst, François Yergeau, Richard Ishida, Misha Wolf, Asmus Freytag, Tex Texin Character Model for the World Wide Web, W3C Working Draft, 30 April 2002.   (See http://www.w3.org/TR/charmod/.)

 

��¼B  ����XML���ƵĽ��飨Suggestions for XML Names��(�ǹ淶��)

����¼B�ı�������Character Classes����normative����Ϊ��Suggestions for XML Names����non-normative�������������ݸ�Ϊ��������֣�

����Ϊ��θ�Ԫ����(element names)��������(attribute names)��PIĿ�꣨PI targets����ʵ������enity names������ʽ����notation names����ID���͵�����ֵ(values of attributes of type ID)����XML���ƣ�XML names����������ѷ�����best practice����

ǰ��������ֱ��ȡ��Unicode��׼3.0���еĹ���ȥ�������е����п����ַ������Ʒǿհ׷��š���ʮ�������֡�˽����;�ַ��������ţ�����ı����Ž�������ע�����������ַ���δ��ֵ�Ĵ���㣨codepoints���Լ��հ��ַ��ȡ������Ľ�����Ҫ����XML 1.0�ĸ�¼B��

��         �������Ƶ����ַ���ӦҪô��Ll��Lu��Lo��Lm��Lt��Nl��[��ע//��Щ�������Unicode���������General Category���ж���ġ�]�е��ַ���Ҫô���ַ� '_'��#x5F����

��         ���ַ�������ַ���ӦҪô��Ll��Lu��Lo��Lm��Lt��Mc��Mn��Nl��Nd��Pc����Cf���е��ַ���Ҫô�������ַ�֮һ��'-' #x2D��'.' #x2E��':' #x3A��'��' #xB7 (Բ��)������Cf���е��ַ�����ֱ�ӿɼ��ģ����ʹ������ʱӦ�������桢����ֻ���ڱ�Ҫ����²���ʹ�ã��Ա��ⱻ������������XML������������ͬ�������˿���ȴ����ͬ�ġ�

��         �����в�Ӧ�������ڱ�׼�ֽ⣨canonical decomposition��[��ע//Unicode�������μ�������]���������֣�������[#xF900-#xFAFF]��[#x2F800-#x2FFFD]��Χ�еģ�������ʮ�����ַ����⣩��

��         �����в�Ӧ�����������ݷֽ⣨compatibility decomposition��[��ע//Unicode�������μ�������]���ַ�������Щ��Unicode�ַ����е�����ֶ������ݸ�ʽ��ǩ���ַ������Ե�����ֶε����ַ�Ϊ��<��Ϊ��־������һ������Ӧ����#x0E33 THAI CHARACTER SARA AM��#x0EB3 LAO CHARACTER AM���������ǵ����ݷֽ�����д���ǵ��ַ�ʱ������ʹ�ã���

��         �����в�Ӧ������Щ�����ڷ��ŵ�����ַ���������Щ��[#x20D0-#x20EF]��[#x1D165-#x1D1AD]�е��ַ�����

��         �����в�Ӧ�����м����ַ���[#xFFF9-#xFFFB]����

��         �����в�Ӧ��������ѡ���ַ���

��         ��Ӧʹ��������ġ����ܷ����ġ��Ѷ��Ļ��������������ƻ��������ơ�