������Ϣ����� W3CHINA.ORG������ |
A website dedicated to promoting the widespread deployment of W3C technologies. A website designed to propagate information on the future of the Web. A website ideally suited for discussions and the exchange of relevant information. |
|
���ģ� |
XML
1.1��ѡ�Ƽ���Unicode�������İ���http://xml1p1.w3china.org�� |
ԭ���� |
XML
1.1 Candidate Recommendation��http://www.w3.org/TR/2002/CR-xml11-20021015�� |
˵���� |
l
���ĵ��Ǹ���2002��10��15�շ�����XML 1.1��ѡ�Ƽ�������ġ� l
���ĵ���Ӣ�İ���Ψһ����ʽ�汾�� l
��Ȼ������Ϊ����֮��ȷ����Ŭ��������֮����������ڡ���ӭ����ָ���� l
��ע�������Ƿ���ʽ�ģ����������߸��˹۵㡣 l
����Ȩ����λ�ڣ� Copyright
© 2002 W3C
® ( MIT
, INRIA
, Keio), All Rights Reserved. W3C liability,
trademark,
document
use and software
licensing rules apply. |
���ߣ� |
�캭��Collin Hsu�� |
ʱ�䣺 |
�״η�����2003��10��28��/��������2003��10��28�� |
��ǰ�汾��
http://www.w3.org/TR/2002/CR-xml11-20021015
���°汾��
��һ�汾��
http://www.w3.org/TR/2002/WD-xml11-20020425/
���ߣ�
John Cowan, Reuters < jcowan@reutershealth.com >
���ĵ���XML Core Working Group�����Ĺ����ɹ���������XML Blueberry Requirements�еĶ����XML 1.1������������XML 1.1����ȥ��˵��XML Blueberry�����ĵ�����������ȡ��XML 1.0�Ƽ���[XML1.0]����һϵ�иĶ��ķ�ʽ�����ĵ���ƪ�±�Ŷ�Ӧ��������XML 1.0�Ƽ����е�ƪ�±�š�������ЩXML 1.0�Ƽ������С������ĵ���û�е�ƪ�£���ʾ����û�б��Ķ���
��һ�����������ĵ��ڷ���ʱ��״̬�����ĵ����ܻᱻ�����ĵ���������ĵ����е�����״̬��W3Cά����
���ĵ���XML 1.1��W3C��ѡ�Ƽ�����W3C Candidate Recommendation����W3C���������棨technical report��[��ע//�������漴W3C�ٷ��������ĵ�]��״̬��Ϊ��ѡ�Ƽ�������ζ�Ÿ��ĵ�����Ϊ���ȶ��ģ���������������ȥʵ���������ں�ѡ�Ƽ���״̬����������μ�Process Document��5.3.2����
һ��XML Core Working Group������XML Activity��һ���֣��μ�ժҪ��֤ʵ���ٴ����������Ի�������ʵ�֣����ǽ�������W3C Director�����淶����Ϊ�����Ƽ�����Proposed Recommendation����������ʵ�ֱ������ɲ�ͬ����֯ʵ�ֵġ�
��ǰ��ʵ�ֱ�����¼�˵�ĿǰΪֹ�����Ѿ��յ���ʵ�ַ���ķ�����
״̬Ϊ��ѡ�Ƽ������ĵ����������ѱ�W3C��Ա�Ͽɡ�����һ���ݰ�����ʱ���ܱ������ĵ����¡��滻�����ϡ������ñ��ĵ�ʱӦע����work in process����
���ĵ��Լ����ĺ����ĵ������ö�XML 1.0�Ƽ��������ĵ���ʽ����д���Ա��ڱ༭�ͼ�顣���յ�XML 1.1�Ƽ�����XML 1.1 Recommendation�����ܲ�ȡ��XML 1.0�Ƽ������б�Ҫ�ĵ���ʽ���г�����
�뱾�ĵ��йص�֪ʶ��Ȩ����ļ�¼������Working Group��s public IPR disclosureҳ���ҵ���
������ȷ����Ա��ĵ��������ۡ���ѡ�Ƽ����ĸ�������UTCʱ��2003��2��14��23��59�ֽ������뽫���۷�����www-xml-blueberry-comments@w3.org�������ṩ��������ѡ��ʽ�����������Լ��ظ����Դ�������ַ��ã�http://lists.w3.org/Archives/Public/www-xml-blueberry-comments/��
���ĵ��ķ������������ѱ�W3C��Ա�Ͽɡ�����һ���ݰ�����ʱ���ܱ������ĵ����¡��滻�����ϡ������ñ��ĵ�ʱӦע����work in process����W3C�Ƽ��������������ĵ���technical document���������б��ɴ�������ַ��ã�http://www.w3.org/TR��
2.2 �ַ�
2.3 ��ͨ�������Ԫ��
2.8 ���Ժ��ĵ���������
2.11 �����
2.13 W3C�淶�����[��]
4.1 �ַ����ú�ʵ������
4.3.4 ʵ���еİ汾��Ϣ[��]
��¼A �ο�����
��¼B �ַ���[�����]
W3C��XML 1.0�Ƽ������������1998�ꡣ����XML 1.0���ڶ��棩�ķ��������������XML 1.0�ڹ���ʲô�������ģ�well-formed��XML�����ԣ����⣩���ֲ��䡣��һ�ȶ��Ի������Ǽ�Ϊ���õġ�Ȼ��Unicode����ΪXML 1.0���������ַ��淶��û�б��ֲ��䣬���Ѿ���2.0����������3.1���������ߡ�������Unicode 2.0��û�е��ַ������Ѿ���ʹ����XML 1.0���ַ����ݣ�character data�����ˡ�Ȼ���������Dz�����������XML���ƣ�XML name��������Ԫ������������������ö������ֵ��PIĿ��ȵȣ��еġ����⣬��Щ��Ӧ������XML�����г��ֵ��ַ����������������Unicode 2.0��һ�µ�ԭ��û�б�������
��XML 1.0֮�������ƣ�name�������忴���������ı䡣Ȼ��XML 1.0�����ƣ�name���ṩ����һ���ϸ�Ķ��壺�����κβ��������ģ����ǽ�ֹ�ġ�XML 1.1������ȴ��������Ƶģ��κβ�����ֹ�ģ�����ij���ض�ԭ�����������ġ����ǵ�Unicode�汾�ķ�չ��Խ��3.1�棬Ϊ�����XML���и���һ���ĸĶ���XML 1.1�������������ַ���������Щ��δ��ָ���ģ��������г��֡�
���⣬XML 1.0��ͼ��Ӧ�����ִ�����ϵͳ����β��������convention������ȴû�п���IBM����IBM���ݣ����ͻ���mainframe������β����������ˣ����ݱ��ع����ͻ��ϵ�XML�ĵ����Ǽ��ı��ļ������ͻ����ɵ�XML 1.0�ĵ�����Υ�����ص���β�����������ڽ���������ǰʹ�����������ת�����̡�������Ҫ�ڴ��ͻ��ͷǴ��ͻ�����ͬ�ڴ�һ���������Ƶ���һ���������乲��ʱ������ֱ�ӵĻ������Ե���Ϊ��Ҫ�����XML 1.1����β�ַ��б���������һ��NEL(#x85)�ַ��������걸�Կ��ǣ�XML 1.1Ҳ֧��Unicode���зָ���#x2028��
���ΪXML�ĵ��е�����Unicode�ַ�����һ�����ı�ʾ��һ��Ӧ���ӵ�������ˣ�XML 1.1����ʹ���ַ����ã�character references�������ô�#x1��#x1F�Ŀ����ַ������д���XML 1.0���DZ���ֹ�ģ������ڽ�׳�ԣ�robustness�����ǣ���Щ�ַ��Բ���ֱ�����ĵ���ʹ�á�Ϊ������ַ�����ʶ��Ľ�׳�ԣ�ԭ����XML 1.0�ĵ����������ɳ��ֵĸ��ӿ����ַ�����#x7F��#x9F�����ڱ������ַ����õ���ʽ���֣��հ��ַ���Ȼ�dz���ģ�������������������Ӱ�첢��������APIs����DZ�ڵ����⣬#x0���DZ���ֹ�ģ�������ֱ��ʹ�ã�Ҳ�������ַ����õ���ʽʹ�ã���
û��ΪXML 1.0����һ�鿱���Ǵ���һ���°汾��XML������Ϊ��Щ�Ķ�Ӱ���������ģ�well-formed��XML�ĵ�������塣XML 1.0��������������ܾ���ЩXML�����к������ַ���ʹ���µ���β��������ͶԿ����ַ������ַ����õ��ĵ�����XML 1.0�ĵ���XML 1.1�ĵ������ֿ���ͨ���ĵ��ײ�XML������XML declaration���еİ汾����Ϣ���жϡ�
������ʽ[2]��Ϊ��
[2] Char ::= #x9 | #xA | #xD | [#x20-#x7E] | #x85 | [#xA0-#xD7FF]
| [#xE000-#xFFFD] | [#x10000-#x10FFFF]
������ʽ[2]��ע��Ϊ��
�κ�Unicode�ַ�����ȥ��ISO�����ַ�����������surrogate blocks��[��ע//��������surrogate blocks��ΪUnicode����������ļ�Ҫ˵����μ�Tim Brayд��Unicode Surrogates]��FFFE��FFFF��
�IJ���ʽ[4]���������µIJ���ʽ[4a]:
[4] NameStartChar := ":" | [A-Z] | "_" | [a-z] |
[#xC0-#x2FF] | [#x370-#x37D] | [#x37F-#x1FFF] |
[#x200C-#x200D] | [#x2070-#x218F] | [#x2C00-#x2FEF] |
[#x3001-#xD7FF] | [#xF900-#xEFFFF]
[4a] NameChar := NameStartChar | "-" | "." | [0-9] | #xB7 |
[#x0300-#x036F] | [#x203F-#x2040]
������ʽ[5]��Ϊ��
[5] Name ::= NameStartChar NameChar*
�ڲ���ʽ[5]������������������֣�
���ƣ�Name���ĵ�һ���ַ�������һ��NameStartChar�������ַ�������NameChars����һ���Ʊ�֤�����Ʋ�����������ASCII�����ֻ��������ַ���combing characters��[��ע//Unicode�������μ�������]��ͷ�����������ַ��������������г��֣�������Щ����������ܱ������ָ������ַ�������Ŀ����Ϊ��ʹ֮��Ϊ���ݵģ�inclusive�������������ģ�exclusive����������û�б�Unicode�������дϵͳ��writing systems��[��ע//Unicode�������μ�������]Ҳ����XML�����б�ʹ�á��������ƴ�������Ľ��飬��μ���¼B��
�����ĵ�����ʹ������Ȼ��������������ִ���ΪXML���ƣ���������������ʹ�÷����ַ���symbolic characters����հ��ַ���whitespace characters����ע�⣺ð�ţ����������ַ���-������ţ�.�����»��ߣ�_����Բ�㣨��������ȷ�����ġ�
��ֹASCII�����ַ���symbols�����������Լ�һ����Unicode�����ַ���XML�����г��֣���Ϊ����XML�ĵ�����ᄈ��ʹ��XML����ʱ������Щ�ַ���Ϊ�ָ������ַ�#0x037E��ϣ���ַ����ʺţ�����ֹ��������Ϊ���ַ��ڹ淶����Ϊ�ֺţ������������ı�ʵ�����õĺ��塣
�Ѳ���ʽ[7]��Ϊ:
[7] Nmtoken ::= NameChar+
�����е���1.0����Ϊ��1.1����
��������������֣�
XML 1.1������ҲӦ���Դ���XML 1.0�ĵ������һ���ĵ��������ģ�well-formed������Ч�ģ�valid��XML 1.0�ĵ������Ҳ�ֱ�Ӱ����κ�[#x7F-#x9F]�е��ַ�����ת���ַ���ʽ���ֵij��⣩����ֻҪ���ĵ���XML�汾�Ÿ�Ϊ��1.1���Ϳ�ʹ֮��Ϊһ�������Ļ���Ч��XML 1.1�ĵ���
���ڶ����滻Ϊ�������֣�:
Ϊ�˼�Ӧ�ó��������XML����������Ӧ�ó�����ַ������Ǿ���XML�������ڽ��н���֮ǰ�ѽ������е��ⲿ�ѽ���ʵ�壨external parsed entities���������ĵ�ʵ�壩�е����л��з��淶������һ��������Ĺ淶����ͨ���������ַ�ȫ���滻Ϊ�ַ�#xA��ɵģ�
��
˫�ַ����� #xD #xA
��
˫�ַ����� #xD #x85
��
�����ַ�#x85
��
�����ַ�#x2028
��
����û�б��ַ�#xA���ַ�#x85������ַ�#xD ��
���е�XML�ѽ���ʵ���������ĵ�ʵ������Ӧ����[Charmod]�еĶ����Լ������XML��ع���ɷ֣�relevant constructs��[��ע//Charmod�е��������μ�������]�IJ��䶨�屻��ȫ�淶����fully normalized��[��ע//CharmodΪ�ı���text��������������εĹ淶������������Ϊ��Unicode�淶����Unicode Normalization����Ƕ��淶����Include Normalization������ȫ�淶����Fully Normalization����]��
��
�����ѽ���ʵ����parsed
entities�����滻�ı���replacemane text��
��
��������������ƥ�����в���ʽ���ı�
o
CData
o
CharData
o
content
o
Name
o
Nmtoken
Ȼ������ʹ�ĵ�δ����ȫ�淶���������������ġ�XML������Ӧ���û�ѡ���Ƿ�Ҫ��֤���������ĵ���û�д�����ȫ�淶����ʽ��fully normalized form��������Ӧ�ó�����֤�Ľ��������[Charmod]�еĹ涨��ֻ���������ı����Ѽ����ģ�certified��[��ע//Certified TextΪCharmod�е��������μ�������]������£���Ӧѡ������֤��
����ȫ�淶������֤���루������ǣ�������֤ʵ����Ƕ��淶����include-normalized�����μ�[Charmod]���ģ�Ȼ����֤�������г�����ع���ɷ�û���Թ����ַ���composing character����ͷ�����ַ����ñ�չ��֮���μ�[Charmod]��������֤�Ĵ�������non-validating processors���������Ƕ��δ���ⲿʵ��ʱ������ɵķǹ淶����denormalization����
ע�⣺�����ַ���composing characters��[��ע//Charmod�е�����������μ�����]Ϊ���з�0������ࣨnon-zero
combining class��[��ע//UnicodeΪÿ�������ָ����һ�����룬�������ָ�������ࡣ��Щ���������ʶ�ã����������κκ��塣]�е��ַ�����������0������ࣨclass-zero���е��ַ���ָ��Щ��ijЩ���ֽ��в���Ϊ���ַ����ַ��������ڹ����ַ�������������ַ���base characters��[��ע//Unicode����������μ�����]�ģ���ˣ�������ع���ɷ֣��������ݣ������Թ����ַ���ͷ������ʵ�ʼ���XML�ı���������
���XML����������ȫ�淶������֤��������������ȷ����淶���������ַ�����������Щ�ַ���[Unicode]�汾����ʵ�ָô�����ʱ�����ǵ��Ǹ�Unicode�汾֮���ģ�����ô���������ԣ������û���ѡ���Կ�������Щ�ַ����µķǹ淶����denormalizations�����⡣�ڿɿ��ԺͰ�ȫ�Լ�Ϊ��Ҫ������£�Ӧ�ó���Ӧѡ�������Щ�ǹ淶����
XML���������������ת��Ϊ��ȫ�淶����ʽ������XML 1.1�����XMLӦ�ó�������������XML 1.0����XML 1.1�ģ�Ӧȷ���������ȫ�淶���ģ��������ڲ��Ĵ�����ʽ������Բ�����ȫ�淶���ġ�
���ڵ���ͼ��ǿ�ҽ���XML������ȷ��XML�ĵ��Ĵ������Ѿ��������ȫ�淶��������XMLӦ�ó���Ϳ��Խ����ַ����Ƚϣ������ص����ַ����Ķ��ֲ�ͬƴд��ʽ������Unicode�����ģ���
��Well-formedness constraint: Legal Character�滻Ϊ����������֣�
���ַ����ã�character reference����ʽ�����õ��ַ�������ϲ���ʽChar��������һ���ڷ�Χ[#x1-#x1F]��[#x7F-#x9F]�ڵ�ISO�����ַ���
ÿ��ʵ�壨�����ĵ�ʵ�壩���Ը��Ա�����ΪXML 1.0��XML 1.1���ĵ�ʵ���еİ汾����ȷ��������XML�ĵ��İ汾��һ��XML 1.1�ĵ����Ե���XML 1.0�ⲿʵ�壬�����Ͳ���Ҫά���ⲿʵ��汾���ظ����ر���DTD�ⲿ�Ӽ�����������������£�XML 1.1�Ĺ���Ӧ���������ĵ���
���һ��ʵ�壨�����ĵ�ʵ�壩û�б����汾�ţ�����Ϊ���İ汾��Ϊ1.0��
�������¹淶�Բο����ϣ�
[XML1.0]
Tim Bray, Jean Paoli, C.M. Sperberg-McQueen, Eve Maler (editors), Extensible Markup Language (XML) 1.0 (Second Edition), 6 October 2000. (See http://www.w3.org/TR/REC-xml .)
[Charmod]
Martin J. D��rst, François Yergeau, Richard Ishida, Misha Wolf, Asmus Freytag, Tex Texin Character Model for the World Wide Web, W3C Working Draft, 30 April 2002. (See http://www.w3.org/TR/charmod/.)
����¼B�ı�������Character Classes����normative����Ϊ��Suggestions for XML Names����non-normative�������������ݸ�Ϊ��������֣�
����Ϊ��θ�Ԫ����(element names)��������(attribute names)��PIĿ�꣨PI targets����ʵ������enity names������ʽ����notation names����ID���͵�����ֵ(values of attributes of type ID)����XML���ƣ�XML names����������ѷ�����best practice����
ǰ��������ֱ��ȡ��Unicode��3.0���еĹ���ȥ�������е����п����ַ������Ʒǿհ��š���ʮ�������֡�˽����;�ַ��������ţ�����ı����Ž�������ע�����������ַ���δ��ֵ�Ĵ���㣨codepoints���Լ��հ��ַ��ȡ������Ľ�����Ҫ����XML 1.0�ĸ�¼B��
�� �������Ƶ����ַ���ӦҪô��Ll��Lu��Lo��Lm��Lt��Nl��[��ע//��Щ�������Unicode���������General Category���ж���ġ�]�е��ַ���Ҫô���ַ� '_'��#x5F����
�� ���ַ�������ַ���ӦҪô��Ll��Lu��Lo��Lm��Lt��Mc��Mn��Nl��Nd��Pc����Cf���е��ַ���Ҫô�������ַ�֮һ��'-' #x2D��'.' #x2E��':' #x3A��'��' #xB7 (Բ��)������Cf���е��ַ�����ֱ�ӿɼ��ģ����ʹ������ʱӦ�������桢����ֻ���ڱ�Ҫ����²���ʹ�ã��Ա��ⱻ������������XML������������ͬ�������˿���ȴ����ͬ�ġ�
�� �����в�Ӧ�������ڱ��ֽ⣨canonical decomposition��[��ע//Unicode�������μ�������]���������֣�������[#xF900-#xFAFF]��[#x2F800-#x2FFFD]��Χ�еģ�������ʮ�����ַ����⣩��
�� �����в�Ӧ�����������ݷֽ⣨compatibility decomposition��[��ע//Unicode�������μ�������]���ַ�������Щ��Unicode�ַ����е�����ֶ������ݸ�ʽ��ǩ���ַ������Ե�����ֶε����ַ�Ϊ��<��Ϊ��־������һ������Ӧ����#x0E33 THAI CHARACTER SARA AM��#x0EB3 LAO CHARACTER AM���������ǵ����ݷֽ�����д���ǵ��ַ�ʱ������ʹ�ã���
�� �����в�Ӧ������Щ�����ڷ��ŵ�����ַ���������Щ��[#x20D0-#x20EF]��[#x1D165-#x1D1AD]�е��ַ�����
�� �����в�Ӧ�����м����ַ���[#xFFF9-#xFFFB]����
�� �����в�Ӧ��������ѡ���ַ���
�� ��Ӧʹ��������ġ����ܷ����ġ��Ѷ��Ļ��������������ƻ��������ơ�