C语言基础教程:掌握数组与字符串操作
逆序输出
读入一些整数,逆序输出到一行中。已知整数不超过100个。
#include <stdio.h> #include <string.h> int maxn[105];//若数组较长则将其设为全局变量 int main (void) { int i=0,x,k; memset(maxn,0,sizeof(maxn));//将数组清零 while((scanf("%d",&x))==1) maxn[i++]=x;//先将x赋值给maxn[i],之后i++ for (k=i-1;k>=0;k--) printf("%d ",maxn[k]); return 0; }
scanf()函数返回值
scanf()函数返回的是成功输入的变量的个数,当输入结束时,scanf()函数无法再次读取x,将返回0。
如何告诉程序输入结束了呢?
是按Enter/空格/TAB键吗?我们会发现,按Enter/空格/TAB键,并没有反应,这是因为程序正在等待输入。
在Windows下,输入完毕后先按Enter键,再按Ctrl+Z键,最后再按Enter键。在Linux下,输入完毕后按Ctrl+D键即可结束输入。
大数组需要定义在函数体外的原因
大数组需要定义在函数体外的原因,全局变量在静态存储区内分配内存,而局部变量是在栈内分配内存空间的。C语言编写的程序会在运行期间创建一个堆栈段,用来保存函数的调用关系和局部变量。而在main函数内部定义大数组相当于在栈内需要一个很大的空间,会造成栈的溢出。
因此,当我们需要定义一个极大的数组时,最好在main 函数外部定义这个大数组。
开灯问题
有n盏灯,编号为1~n。第1个人把所有灯打开,第2个人按下所有编号为2的倍数的开关(这些灯将被关掉),第3个人按下所有编号为3的倍数的开关(其中关掉的灯将被打开,开着的灯将被关闭)依此类推。一共有k个人,问最后有哪些灯开着?输入n和k,输出开着的灯的编号。k≤n≤1000。
样例输入:
7 3
样例输出:
1 5 6 7
分析:用a[1],a[2],a[3]……a[n]表示编号为1,2,3……n的灯是否开着。
#include <stdio.h> #include <string.h> int a[1000]; int main (void) { int n,k,i,j; scanf("%d%d",&n,&k); memset(a,0,sizeof(a));//数组清零 //0和1表示开灯和关灯两种状态 for(i=1;i<=k;i++)//人 for (j=1;j<=n;j++)//灯 if (j%i==0) { if (a[j]==0) a[j]=1; else a[j]=0; } for(i=1;i<=n;i++) if (a[i]==1) printf("%d ",i); printf("\n"); return 0; }
0表示灯关的状态,1表示灯开的状态。从第一个人开始,判断是否是1~n编号的倍数,如果是的话,改变灯的状态,即原来是1,变为0;原来是0,变为1。
回文字
输入一个字符串,判断它是否为回文串以及镜像串。输入字符串保证不含数字0。所谓回文串,就是反转以后和原串相同,如abba和madam。所有镜像串,就是左右镜像之后和原串相同,如2S和3AIAE。注意,并不是每个字符在镜像之后都能得到一个合法字符。在本题中,每个字符的镜像如图所示(空白项表示该字符镜像后不能得到一个合法字符)。
输入的每行包含一个字符串(保证只有上述字符。不含空白字符),判断它是否为回文
串和镜像串(共4种组合)。每组数据之后输出一个空行。
样例输入:
NOTAPALINDROME
ISAPALINILAPASI
2A3MEAS
ATOYOTA
样例输出:
NOTAPALINDROME – is not a palindrome.
ISAPALINILAPASI – is a regular palindrome.
2A3MEAS – is a mirrored string.
ATOYOTA – is a mirrored palindrome.
分析过程可以看这篇:【C语言】经典题目二
下面是代码实现:
#include<stdio.h> #include<string.h> int main (void) { char s[128]={0}; int i,j,k,n; int flagH=1,flagJ=1; const char a[80]="AEHIJLMOSTUVWXYZ12358"; const char b[80]="A3HILJMO2TUVWXY51SEZ8"; gets(s); n=strlen(s); //判断是否是回文串 for(i=0,k=n-1;i<k;i++,k--) { if (s[i]!=s[k]) { flagH=0; break; } } //判断是否是镜像串 for(i=0,k=n-1;i<k;i++,j--) { for (j=0;s[j]!=0;j++) { if (s[i]==a[j]) { if (s[k]!=b[j]) { flagJ=0; } } } if (flagJ==0) break; } //根据标志量判断 if(flagH==1 && flagJ==1) printf("%s -- is a mirrored palindrome.",s); else if (flagH==1 &&flagJ==0) printf(" %s-- is a regular palindrome.",s); else if (flagH==0 && flagJ==1) printf("%s -- is a mirrored string.",s); else printf("%s-- is not a palindrome.",s); return 0; }
习题
得分(score)
给出一个由O和X组成的串(长度为1~80),统计得分。每个O的得分为目前连续出现
的O的个数,X的得分为0。例如,OOXXOXXOOO的得分为1+2+0+0+1+0+0+1+2+3。
分析:对键盘输入的长串的每个字符进行判断。设置总和tot=0,若是X,则tot不累加。若是O,则需要判断前面O字符连续出现的个数。
#include<stdio.h> int main (void) { char a[80]={0}; int tot=0,i,k; gets(a); for(i=0;a[i]!='\0';i++) { if (a[i]=='O') { tot+=1; for (k=i-1;k>=0;k--) { if (a[k]!='O') break; else tot+=1; } } } printf("%d\n",tot); return 0; }
分子量(Molar Mass)
给出一种物质的分子式(不带括号),求分子量。本题中的分子式只包含4种原子,分
别为C, H, O, N,原子量分别为12.01, 1.008, 16.00, 14.01(单位:g/mol)。例如,C6H5OH的
分子量为94.108g/mol。
分析:对输入的分子式的每个元素进行循环,其中会有数字和’C’,‘H’,‘O’,'N’四个字母,而我们只对四个字母进行判断。若是的话,看其后的一位是否为数字,若是,需要此原子量×数字,若不是,只需加它本身就可以了。
这里需要解决的是,如果输入的字符数组a中的元素等于’C’或’H’或’O’或’N’,如何利用其对应的原子量?
这里用结构体解决比较方便。可以将’C‘与其原子量12.01进行“捆绑”,将’H‘与其原子量1.008进行“捆绑”,将’O‘与其原子量16.00进行“捆绑”,将’N‘与其原子量14.01进行捆绑。
#include<stdio.h> struct Molar { char atom; double mass; }; int main (void) { char a[30]={0}; int i,k; double tot=0; gets(a); struct Molar b[4]={'C',12.01,'H',1.008,'O',16.00,'N',14.01}; for (i=0;a[i]!='\0';i++)//遍历输入的a字符数组 { for (k=0;k<=3;k++) if(a[i]==b[k].atom) { if (a[i+1]>='1' && a[i+1]<='9')//判断字符其后一位是否为数字 tot+=b[k].mass * (a[i+1]-'0');//注意分子式中的数字都是以字符型存入字符数组的 else tot+=b[k].mass; } } printf("%lf \n",tot); return 0; }
数数字(Digit Counting)
把前n(n≤10000)个整数顺次写在一起:123456789101112…数一数0~9各出现多少次(输出10个整数,分别是0,1,…,9出现的次数)。
分析:利用sprintf()函数将1~10000输出到字符数组中。存入完毕后,对字符数组进行遍历即可。
关于memset()函数
memset()函数初始化是以一个字节为单位的,也就是说,对字符数组才能初始化为任意值。
memset()函数可以很方便将字符数组全部数组全部初始化为某一个值,例如:
c char a[20]; memset(a,'\0',sizeof(a))
将字符数组亲空。
#include<stdio.h> #include<string.h> char a[100000]; int main (void) { int k=0,i; int b[10]={0};//用于记录1~9出现的次数 char x;//记从键盘读入的数字字符 memset(a,'\0',sizeof(a));//将字符数组清零 scanf("%s",a); //对数组a进行遍历 for(k=0;a[k]!='\0';k++) b[a[k]-'0']++; //输出数组b for(k=0;k<=9;k++) printf("%d ",b[k]); return 0; }
周期串 (Periodic Strings)
如果一个字符串可以由某个长度为k的字符串重复多次得到,则称该串以k为周期。例如,abcabcabcabc以3为周期(注意,它也以6和12为周期)。
输入一个长度不超过80的字符串,输出其最小周期。
分析:对于一个字符串,其周期一定是字符串长度的因子,因此只对因子判断即可。
如何判断是否是周期呢?例如3为一个周期,则一定满足a[0]=a[0+3],a[1]=a[1+3],a[2]=a[2+3];
但是要做判断的话,满足的如上条件是仅仅不够的。例如会出现abcabcdddabcabcddd这种情况。所以我们需要对整个字符串进行判断。
#include <stdio.h> #include <string.h> int main (void) { int i,k,len,n; int flag; //设置标志量 char s[80]; gets(s); len=strlen(s); for(i=1;i<=len;i++) { if (len%i==0) //判断是否是因子 //若是,判断能否为周期 { flag=1; for (k=0;k<i;k++) { for (n=1;n<=len/i-1;n++) { if (s[k]!=s[k+n*i]) flag=0; } } } if (flag==1) { printf("%d\n",i); break; } } return 0; }
DNA序列(DNA Consensus String)
输入m个长度均为n的DNA序列,求一个DNA序列,到所有序列的总Hamming距离尽量
小。两个等长字符串的Hamming距离等于字符不同的位置个数,例如,ACGTGCGAHamming距离为2(左数第1, 4个字符不同)。
输入整数m和n(4≤m≤50, 4≤n≤1000),以及m个长度为n的DNA序列(只包含字母A,C,G,T),输出到m个序列的Hamming距离和最小的DNA序列和对应的距离。如有多
解,要求为字典序最小的解。例如,对于下面5个DNA序列,最优解为TAAGATAC。
TATGATAC
TAAGCTAC
AAAGATCC
TGAGATAC
TAAGATGT
后来发现的问题:都错题了!!!求一个DAN序列,这是重点!
我的问题是从输入的DAN序列中找DAN序列,使得到所有的序列的总Hanming距离最小。
如果把题目改成这样的基础版,下面是分析过程。
分析:
首先是要处理m个DAN序列的储存,我们可以利用二维数组进行存储(因为二维数组可以看作是很多个一维数组组成。)
其次是如何如何找出最优解。其实就是,第一个序列和剩下的所有的序列进行比较,然后出现不同的字符,……(这个和我们熟悉的选择排序是不一样的,因为选择排序是和它后面的每一个数字进行比较,而这个是和所有的进行比较。)
那么如何储存每个序列总Hamming距离呢?不妨可以放在一个数组中用来存放。
那么如何输出呢?我们需要边存储边记录,设置变量min,若在每一次的比较中,有总HAMMING距离小于min,那么将此赋值给min,并将此时的DAN序列拷贝到字符数组s中。最终输出s即可。
这里需要注意的是,题目要求如有多解,要求为字典序最小的解。所以我们可以试着从最后一个DAN序列开始循环。
推荐阅读
-
简单易懂!C++中字符数组的输入与输出操作:原样显示字符串
-
C语言基础教程:掌握数组与字符串操作
-
C语言编程基础30讲:重点讲解数组、字符串数组及输入输出操作的注意事项
-
F#探险之旅(二):函数式编程(上)-函数式编程范式简介 F#主要支持三种编程范式:函数式编程(Functional Programming,FP)、命令式编程(Imperative Programming)和面向对象(Object-Oriented,OO)的编程。回顾它们的历史,FP是最早的一种范式,第一种FP语言是IPL,产生于1955年,大约在Fortran一年之前。第二种FP语言是Lisp,产生于1958,早于Cobol一年。Fortan和Cobol都是命令式编程语言,它们在科学和商业领域的迅速成功使得命令式编程在30多年的时间里独领风骚。而产生于1970年代的面向对象编程则不断成熟,至今已是最流行的编程范式。有道是“*代有语言出,各领风骚数十年”。 尽管强大的FP语言(SML,Ocaml,Haskell及Clean等)和类FP语言(APL和Lisp是现实世界中最成功的两个)在1950年代就不断发展,FP仍停留在学院派的“象牙塔”里;而命令式编程和面向对象编程则分别凭着在商业领域和企业级应用的需要占据领先。今天,FP的潜力终被认识——它是用来解决更复杂的问题的(当然更简单的问题也不在话下)。 纯粹的FP将程序看作是接受参数并返回值的函数的集合,它不允许有副作用(side effect,即改变了状态),使用递归而不是循环进行迭代。FP中的函数很像数学中的函数,它们都不改变程序的状态。举个简单的例子,一旦将一个值赋给一个标识符,它就不会改变了,函数不改变参数的值,返回值是全新的值。 FP的数学基础使得它很是优雅,FP的程序看起来往往简洁、漂亮。但它无状态和递归的天性使得它在处理很多通用的编程任务时没有其它的编程范式来得方便。但对F#来说这不是问题,它的优势之一就是融合了多种编程范式,允许开发人员按照需要采用最好的范式。 关于FP的更多内容建议阅读一下这篇文章:Why Functional Programming Matters(中文版)。F#中的函数式编程 从现在开始,我将对F#中FP相关的主要语言结构逐一进行介绍。标识符(Identifier) 在F#中,我们通过标识符给值(value)取名字,这样就可以在后面的程序中引用它。通过关键字let定义标识符,如: let x = 42 这看起来像命令式编程语言中的赋值语句,两者有着关键的不同。在纯粹的FP中,一旦值赋给了标识符就不能改变了,这也是把它称为标识符而非变量(variable)的原因。另外,在某些条件下,我们可以重定义标识符;在F#的命令式编程范式下,在某些条件下标识符的值是可以修改的。 标识符也可用于引用函数,在F#中函数本质上也是值。也就是说,F#中没有真正的函数名和参数名的概念,它们都是标识符。定义函数的方式与定义值是类似的,只是会有额外的标识符表示参数: let add x y = x + y 这里共有三个标识符,add表示函数名,x和y表示它的参数。关键字和保留字关键字是指语言中一些标记,它们被编译器保留作特殊之用。在F#中,不能用作标识符或类型的名称(后面会讨论“定义类型”)。它们是: abstract and as asr assert begin class default delegate do donedowncast downto elif else end exception extern false finally forfun function if in inherit inline interface internal land lazy letlor lsr lxor match member mod module mutable namespace new nullof open or override private public rec return sig static structthen to true try type upcast use val void when while with yield 保留字是指当前还不是关键字,但被F#保留做将来之用。可以用它们来定义标识符或类型名称,但编译器会报告一个警告。如果你在意程序与未来版本编译器的兼容性,最好不要使用。它们是: atomic break checked component const constraint constructor continue eager event external fixed functor global include method mixinobject parallel process protected pure sealed trait virtual volatile 文字值(Literals) 文字值表示常数值,在构建计算代码块时很有用,F#提供了丰富的文字值集。与C#类似,这些文字值包括了常见的字符串、字符、布尔值、整型数、浮点数等,在此不再赘述,详细信息请查看F#手册。 与C#一样,F#中的字符串常量表示也有两种方式。一是常规字符串(regular string),其中可包含转义字符;二是逐字字符串(verbatim string),其中的(")被看作是常规的字符,而两个双引号作为双引号的转义表示。下面这个简单的例子演示了常见的文字常量表示: let message = "Hello World"r"n!" // 常规字符串let dir = @"C:"FS"FP" // 逐字字符串let bytes = "bytes"B // byte 数组let xA = 0xFFy // sbyte, 16进制表示let xB = 0o777un // unsigned native-sized integer,8进制表示let print x = printfn "%A" xlet main = print message; print dir; print bytes; print xA; print xB; main Printf函数通过F#的反射机制和.NET的ToString方法来解析“%A”模式,适用于任何类型的值,也可以通过F#中的print_any和print_to_string函数来完成类似的功能。值和函数(Values and Functions) 在F#中函数也是值,F#处理它们的语法也是类似的。 let n = 10let add a b = a + blet addFour = add 4let result = addFour n printfn "result = %i" result 可以看到定义值n和函数add的语法很类似,只不过add还有两个参数。对于add来说a + b的值自动作为其返回值,也就是说在F#中我们不需要显式地为函数定义返回值。对于函数addFour来说,它定义在add的基础上,它只向add传递了一个参数,这样对于不同的参数addFour将返回不同的值。考虑数学中的函数概念,F(x, y) = x + y,G(y) = F(4, y),实际上G(y) = 4 + y,G也是一个函数,它接收一个参数,这个地方是不是很类似?这种只向函数传递部分参数的特性称为函数的柯里化(curried function)。 当然对某些函数来说,传递部分参数是无意义的,此时需要强制提供所有参数,可是将参数括起来,将它们转换为元组(tuple)。下面的例子将不能编译通过: let sub(a, b) = a - blet subFour = sub 4 必须为sub提供两个参数,如sub(4, 5),这样就很像C#中的方法调用了。 对于这两种方式来说,前者具有更高的灵活性,一般可优先考虑。 如果函数的计算过程中需要定义一些中间值,我们应当将这些行进行缩进: let halfWay a b = let dif = b - a let mid = dif / 2 mid + a 需要注意的是,缩进时要用空格而不是Tab,如果你不想每次都按几次空格键,可以在VS中设置,将Tab字符自动转换为空格;虽然缩进的字符数没有限制,但一般建议用4个空格。而且此时一定要用在文件开头添加#light指令。作用域(Scope)作用域是编程语言中的一个重要的概念,它表示在何处可以访问(使用)一个标识符或类型。所有标识符,不管是函数还是值,其作用域都从其声明处开始,结束自其所处的代码块。对于一个处于最顶层的标识符而言,一旦为其赋值,它的值就不能修改或重定义了。标识符在定义之后才能使用,这意味着在定义过程中不能使用自身的值。 let defineMessage = let message = "Help me" print_endline message // error 对于在函数内部定义的标识符,一般而言,它们的作用域会到函数的结束处。 但可使用let关键字重定义它们,有时这会很有用,对于某些函数来说,计算过程涉及多个中间值,因为值是不可修改的,所以我们就需要定义多个标识符,这就要求我们去维护这些标识符的名称,其实是没必要的,这时可以使用重定义标识符。但这并不同于可以修改标识符的值。你甚至可以修改标识符的类型,但F#仍能确保类型安全。所谓类型安全,其基本意义是F#会避免对值的错误操作,比如我们不能像对待字符串那样对待整数。这个跟C#也是类似的。 let changeType = let x = 1 let x = "change me" let x = x + 1 print_string x 在本例的函数中,第一行和第二行都没问题,第三行就有问题了,在重定义x的时候,赋给它的值是x + 1,而x是字符串,与1相加在F#中是非法的。 另外,如果在嵌套函数中重定义标识符就更有趣了。 let printMessages = let message = "fun value" printfn "%s" message; let innerFun = let message = "inner fun value" printfn "%s" message innerFun printfn "%s" message printMessages 打印结果: fun value inner fun valuefun value 最后一次不是inner fun value,因为在innerFun仅仅将值重新绑定而不是赋值,其有效范围仅仅在innerFun内部。递归(Recursion)递归是编程中的一个极为重要的概念,它表示函数通过自身进行定义,亦即在定义处调用自身。在FP中常用于表达命令式编程的循环。很多人认为使用递归表示的算法要比循环更易理解。 使用rec关键字进行递归函数的定义。看下面的计算阶乘的函数: let rec factorial x = match x with | x when x < 0 -> failwith "value must be greater than or equal to 0" | 0 -> 1 | x -> x * factorial(x - 1) 这里使用了模式匹配(F#的一个很棒的特性),其C#版本为: public static long Factorial(int n) { if (n < 0) { throw new ArgumentOutOfRangeException("value must be greater than or equal to 0"); } if (n == 0) { return 1; } return n * Factorial (n - 1); } 递归在解决阶乘、Fibonacci数列这样的问题时尤为适合。但使用的时候要当心,可能会写出不能终止的递归。匿名函数(Anonymous Function) 定义函数的时候F#提供了第二种方式:使用关键字fun。有时我们没必要给函数起名,这种函数就是所谓的匿名函数,有时称为lambda函数,这也是C#3.0的一个新特性。比如有的函数仅仅作为一个参数传给另一个函数,通常就不需要起名。在后面的“列表”一节中你会看到这样的例子。除了fun,我们还可以使用function关键字定义匿名函数,它们的区别在于后者可以使用模式匹配(本文后面将做介绍)特性。看下面的例子: let x = (fun x y -> x + y) 1 2let x1 = (function x -> function y -> x + y) 1 2let x2 = (function (x, y) -> x + y) (1, 2) 我们可优先考虑fun,因为它更为紧凑,在F#类库中你能看到很多这样的例子。 注意:本文中的代码均在F# 1.9.4.17版本下编写,在F# CTP 1.9.6.0版本下可能不能通过编译。 F#系列随笔索引页面