阿里巴巴笔试

阿里巴巴笔试

【范文精选】阿里巴巴笔试

【范文大全】阿里巴巴笔试

【专家解析】阿里巴巴笔试

【优秀范文】阿里巴巴笔试

范文一:阿里巴巴笔试题

http://www.tanhui.org.cn/

http://www.tanhui.org.cn/

http://www.tanhui.org.cn/

http://www.tanhui.org.cn/

http://www.tanhui.org.cn/

http://www.tanhui.org.cn/

http://www.tanhui.org.cn/

http://www.tanhui.org.cn/

http://www.tanhui.org.cn/

http://www.tanhui.org.cn/

http://www.tanhui.org.cn/

http://www.tanhui.org.cn/

http://www.tanhui.org.cn/

http://www.tanhui.org.cn/

原文地址:http://fanwen.wenku1.com/article/14636005.html

范文二:阿里巴巴java笔试

阿里巴巴java笔试

Question 1. (单选)

在60年代初石油危机的时候,美国总统肯尼迪要求美国石油公司不要将石油的价格提得太快,但是美国石油公司拒绝了肯尼迪的要求。因此,肯尼迪总统在记者招待会上说:“很久以前,我的父亲告诉我,所有的商人都是见钱眼开的„„直到今天我才相信这是真的。” 肯尼迪总统的讲话是以下面哪项假设为前提的? 3

1. 美国的企业应该听从政府的指示。

2. 美国的企业完全与政府不相干。

3. 美国石油公司在石油危机时的提价措施使自己有利可图。

4. 美国的石油价格应该不受世界石油价格的影响。

Question 2. (单选)

我国多数企业完全缺乏“专利意识”。根据中国专利局最近对500家大中型企业专利工作的一次调查结果表明,在做科研或新产品规划时制定了专利计划的仅有27%。

下列各项如果为真,哪一个最能削弱上述观点?

1. 在被调查的500家企业以外,有一部分企业也制定了专利计划。

2. 一些企业不知道怎样制定专利计划。

3. “专利意识”和申请专利是两回事。

4. 没制定专利计划的企业不一定没有“专利意识”。

Question 3. (单选)

李白无事街上走,提壶去买酒。遇店加一倍,见花喝一斗。三遇店和花,喝光壶中酒。试问壶中原有多少酒?

1. 1/2斗。

2. 2/3斗。

3. 4.5斗。

4. 7/8斗。

Question 4. (单选)

有些教员也拥有了私人汽车,所有的大款都有私人汽车。因此,有些教员也是大款。 以下哪个推理具有和上述推理最为类似的结构?

1. 有些有神论者是佛教徒,所有的基督教徒都不是佛教徒。因此,有些有神论者不是基督教徒。

2. 有些南方人爱吃辣椒,所有的南方人都习惯吃大米,因此,有些习惯吃大米的人爱吃辣

椒。

3. 有些进口货是假货,所有国内组装的1PR空调机的半成品都是进口货。因此,有些1PR空调机半成品是假货。

4. 有些自然物品具有审美价值,所有的艺术品都有审美价值。因此,有些自然物品也是艺术品。

Question 5. (单选)

不可能所有的花都结果。

以下哪项断定的含义,与上述断定最为接近?

1. 可能所有的花都不结果。

2. 可能有的花不结果。

3. 可能有的花结果。

4. 必然有的花不结果。

Question 6. (单选)

电冰箱的问世引起了冰市场的崩溃,以前人们用冰来保鲜食物,现在电冰箱替代了冰的作用。同样道理,由于生物工程的成果,研究出能抵抗害虫的农作物,则会引起什么后果? 以下哪项是上述问题的最好回答?

1. 增加种子成本。

2. 农田的价值下降。

3. 化学农药的需求减少。

4. 饲养家畜的农民数量下降。

Question 7. (单选)

某法院审理一起盗窃案件,某村的甲、乙、丙三人作为嫌疑犯被押上法庭。审问开始了。法官先问甲:“你是怎样作案的?”由于甲说的是方言,法官听不懂。于是,法官就间乙和丙:“刚才甲是如何回答我的问题的?”乙说:“甲的意思是,他并不是盗窃犯。”丙说:“甲刚才招供了,他承认自己是盗窃犯。”法官听完了乙和丙的话之后,马上做出判断:释放乙,逮捕丙入狱。事实证明法官的判断是正确的。

法官做出准确判断最不可能依据的假定是什么?

1. 初审时,在没有胁迫的情况下,甲不论是否是盗窃犯,他总会回答说:我不是盗窃犯。

2. 初审时,在没有胁迫的情况下,说真话的不会是盗窃犯,而说假话的是盗窃犯。

3. 丙在转述甲的回答中说了假话。

4. 据某村村民反映,丙以前曾多次盗窃人家的财物。

Question 8. (单选)

许多神学家坚持上帝的存在说,理由是:谁能够证明上帝不存在呢?

以下诸项中,具有与上述引文相同论证错误的是:

1. 哥德巴赫猜想是成立的,即每个大于6的偶数都可表示为两个素数之和。理由是:没有人能找到这样的偶数不能表示为两个素数之和。

2. 有人说小李是个品行不端的人,理由是:他的爸爸不是个好东西。

3. 许多人认为大米没有白面营养价值高,理由是:为什么很多人不喜欢吃大米呢?

4. 有人坚持托勒密的“地心说”,理由是:亚里斯多德是这么认为的。

Question 9. (单选)

主人每天早晨给小猴子三颗荔枝,晚上四颗,小猴子很不高兴。于是主人很大方他说:“好吧!从明天起早晨给你四颗,晚上三颗。”小猴子开心极了。

下列哪项与上述寓言有相同的欺骗手法?

1. 许多厂家为了推销自己的产品,常常给对方经办人员5%左右的回扣,以此为诱饵,增加对方的订货。

2. .“佳美”羊毛衫零售价一般是200元,但销路很不好。某一商店突发奇招,在柜台前贴一张海报:佳美羊毛衫,原价250元,现价200元,八折优惠。从此门庭若市。

3. 某烟贩销售假“红塔山”,8元一包,并谎称是批发价,结果顾客抢购如潮。

4. 张某为实现自己非分之想,给领导李某1万元好处费,结果是李某开心,张某称心。 Question 10. (单选)

英国哲学家伯特兰·罗素有一个关于归纳主义者火鸡的故事。在火鸡饲养场里,有一只火鸡发现,第一天上午9点钟主人给它喂食。然而作为一个卓越的归纳主义者,它并不马上作出结论。它一直等到已收集了有关上午9点给它喂食这一经验事实的大量观察;而且,它是在多种情况下进行这些观察的:雨天和晴天,热天和冷天,星期三和星期四„„它每天都在自己的记录表中加进新的观察陈述。最后,它的归纳主义良心感到满意,它进行归纳推理,得出了下面的结论:“主人总是在上午9点钟给我喂食。”可是,事情并不像它所想像的那样简单和乐观。在圣诞节前夕,当主人没有给它喂食,而是把它宰杀的时候,它通过归纳概括而得到的结论终于被无情地推翻了。大概火鸡临终前也会因此而感到深深遗憾。 在这则故事中,火鸡的归纳及其失败类似于下面哪项?

1. 在过去很长一段时间里,由于人们一直不曾看见白色以外颜色的天鹅,认为天鹅都是白色的,直到澳州发现黑天鹅才推翻这一结论。

2. 过去人们一直在物理上绝对相信“以太”的存在,直到爱因斯但相对论提出后,才推翻“以太”存在说。

3. 一个识字的人出于对他所读不懂的书的神秘感,而认为“所有的书都是好的”。当然这个结论是不成立的。

4. 甲地有一座金矿,综合考察乙地的各项地理条件类似甲地而认为乙地也有金矿,实际开采发觉这个结论是错误的。

Question 11. (单选)

用二分法查找一个长度为10的、排好序的线性表,查找不成功时,最多需要比较多少次?

1. 5

2. 2

3. 4

4. 1

Question 12. (单选)

80386微处理器的实存容量为

1. 64KB

2. 512KB

3. 1MB

4. 2MB

Question 13. (单选)

下列哪一个关键码序列不符合堆的定义?

1. A、C、D、G、H、M、P、Q、R、X

2. A、C、M、D、H、P、X 、G、0、R

3. A、D、P、R、C、Q、X 、M、H、G

4. A、D、C、M、P、G、H、X 、R、Q

Question 14. (单选)

下列各种操作的时间中,哪一个不属于活动头硬盘的存取访问时间?

1. 寻道时间0

2. 旋转延迟时间

3. 定位时间

4. 传送时间

Question 15. (单选)

下列对MD5的叙述不正确的是:

1. 是一种散列算法

2. 指纹(摘要)的长度为128位

3. 是一种对称加密算法

4. 可用来校验数据的完整性

与逆波兰表达式ab+cd+*对应的中缀表达式是:

1. a+b+c*d

2. (a+b)*c+d

3. (a+b)*(c+d)

4. a+b*c+d

Question 17. (单选)

HTTP 1.1协议中规定表示正常响应的状态代码是

1. 0

2. 100

3. 200

4. 400

Question 18. (单选)

在SOCKET通信过程中,下列哪些函数是客户端需要调用,但是服务端不需要调用的函数?

1. socket()

2. bind()

3. connect()

4. send()

Question 19. (单选)

将网络地址映射为链路层相应地址的协议是

1. DNS

2. TCP

3. ARP

4. ICMP

Question 20. (单选)

int listen(SOCKET s, int backlog);该函数中第二个参数的含义

1. 是否打开log信息

2. 是否打开后台log信息

3. 后台等待连接队列的最大限制值

4. 后台等待连接队列的最小限制值

5. 无意义

交换机不具有下面哪项功能

1. 交换机不具有下面哪项功能

2. 回路避免

3. 路由转发

4. 地址学习

Question 22. (单选)

下面哪种网络设备用来隔绝广播

1. 集线器

2. 交换机

3. 路由器

Question 23. (单选)

SMTP的主要功能是什么

1. 提供有关网络设备的管理信息

2. 在路由器接口层监控安全边界

3. 在主机间传输邮件

4. 提供端口利用信息

Question 24. (单选)

下面关于通道的叙述中,正确的是Ⅰ.通道相当于一个功能简单的处理机Ⅱ.通道完成数据输入输出工作Ⅲ.通道与CPU共用一个内存

1. Ⅰ和Ⅱ

2. Ⅰ和Ⅲ

3. Ⅱ和Ⅲ

4. 都是

Question 25. (单选)

某二叉树结点的对称序序列为A、B、C、D、E、F、G,后序序列为B、D、C、A、F、G、E。该二叉树对应的树林结点的层次次序序列为

1. E、G、F、A、C、D、B

2. E、A、C、B、D、G、F

3. E、A、G、C、F、B、D

4. E、G、A、C、D、F、B

有六个元素6,5,4,3,2,1 的顺序进栈,问下列哪一个不是合法的出栈序列?(????)

1. 5 4 3 6 1 2

2. 4 5 3 1 2 6

3. 4 3 5 2 1 6

4. 2 3 4 1 5 6

5. 3 4 6 5 2 1

Question 27. (单选)

下面的哪个序列可能是二叉搜索树中序遍历的结果

1. 73 8 2 9 4 11

2. 2 3 4 7 8 9 11

3. 11 2 9 3 8 4 7

4. 以上均可

Question 28. (单选)

假设一棵二叉树的后序遍历序列为 DGJHEBIFCA ,中序遍历序列为 DBGEHJACIF ,则其前序遍历序列为 ( ) 。

1. ABCDEFGHIJ

2. ABDEGHJCFI

3. ABDEGHJFIC

4. ABDEGJHCFI

Question 29. (单选)

下面叙述正确的是。

1. 算法的执行效率与数据的存储结构无关

2. 算法的空间复杂度是指算法程序中指令(或语句)的条数

3. 算法的有穷性是指算法必须能在执行有限个步骤之后终止

4. 以上三种描述都不对

Question 30. (单选)

启发式搜索一般是何种算法的改进

1. 深度优先搜索

2. 广度优先搜索

3. 动态规划

4. 贪婪法

字符串通常采用的两种存储方式是

1. 散列存储和索引存储

2. 索引存储和链式存储

3. 顺序存储和链式存储

4. 散列存储和顺序存储

Question 32. (单选)

汉诺塔(Hanoi)问题中令h(n)为从A移动n个金片到C上所用的次数,则递归方程为

1. h(n)=2hn-1

2. h(n) = 2h(n-1)+1

3. h(n)=2^n-n*h-1

4. h(n)=2h*n-1

Question 33. (多选)

栈是一种依赖于以下哪种实现的结构

1. 先进/后出

2. 后进/先出

3. 先来先用

4. 先进/先出

5. 后进/后出

Question 34. (多选)

下列叙述哪些是对的。

1. 线性表的逻辑顺序与物理顺序总是一致的。

2. 线性表的顺序存储表示优于链式存储表示。

3. 线性表若采用链式存储表示时所有结点之间的存储单元地址可连续可不连续。

4. 二维数组是其数组元素为线性表的线性表。

5. 每种数据结构都应具备三种基本运算:插入、删除和搜索。

Question 35. (单选)

下面描述中正确的为:

1. 线性表的逻辑顺序与物理顺序总是一致的。

2. 线性表的顺序存储表示优于链式存储表示。

3. 线性表若采用链式存储表示时所有结点之间的存储单元地址可连续可不连续。

4. 二维数组是其数组元素为线性表的线性表。

Question 36. (单选)

在数据库的如下两个表中,若雇员信息的主键是雇员号,部门信息表的主键是部门号,在下列所给的操作中,哪个操作不能执行?雇员信息表: 雇员号 雇员名 部门号 工资 001 张山 02 2000 010 王宏达 01 1200 056 马林生 02 1000 101 赵敏 04 1500 部门信息表 部门号部门名 主任 01 业务部 李建 02 销售部 应伟东 03 服务部 周垠 04 财务部 陈力胜

1. 从雇员信息表中删除行('010','王宏达','01',1200)

2. 将行('102','赵敏','01',1500)插入到雇员信息表中

3. 将雇员信息表中雇员号='010'的工资改为1600元

4. 将雇员信息表中雇员号='101'的部门号改为' 05'

Question 37. (单选)

数据存储在磁盘上的排列方式会影响I/O服务的总时间。假设每磁道划分成10个物理块,每块存放1个逻辑记录。逻辑记录R1,R2,„,R10存放在同一个磁道上。假定磁盘的旋转速度为20ms/周,磁头当前处在R1的开始处。若系统顺序处理这些记录,使用单缓冲区,每个记录处理时间为4ms,对信息存储进行优化分布后,处理10个记录的最少时间为()

1. 40ms

2. 60ms

3. 120ms

4. 160ms

Question 38. (单选)

某软件公司在招聘软件评测师时,应聘者甲向公司作如下保证: 1.经过自己测试的软件今后不会再出现问题; 2.在工作中对所有程序员一视同仁,不会因为在某个程序员编写的程序中发现的问题多,就重点审查该程序,以免不利于团结; 3.承诺不需要其它人员,自己就可以独立进行测试工作; 4.发扬咬定青山不放松的精神,不把所有问题都找出来,决不罢休。你认为应聘者甲的保证( )

1. 1 4是正确的

2. 2 是正确的

3. 都是正确的

4. 都不正确

Question 39. (单选)

现在向银行存款,年利率为i,若希望在n年后从银行得到F元,现在应该存入的钱数为

1. i /(1+ F)n

2. F/(1+i n)

3. F/in

4. F/(1+i)n

Question 40. (单选)

如果互连的局域网高层分别采用TCP/IP协议与SPX/IPX协议,那么我们可以选择的互连设备应该是

1. 中继器

2. 网桥

3. 网卡

4. 路由器

Question 41. (多选)

有两台游戏服务器运行于linux 2.6.x内核上,需要同步用户访问日志,你会用下列哪些方法同步日志(开放题:假设权限和条件均可满足)?

1. rsync

2. wget

3. scp

4. ftp

5. 还有更多(举例说明,正确者加分)

Question 42. (多选)

linux 2.6.* 内核支持的文件系统有:

1. ext3

2. ext2

3. ext4

4. xfs

5. ufs

Question 43. (单选)

最影响应用性能的因素是:

1. cpu 的快慢

2. 磁盘的快慢

3. 内存的快慢

4. 显卡的快慢

5. 网卡的快慢

php是一门:

1. 编译语言

2. 解释语言

3. 脚本语言

Question 45. (单选)

用ext2格式化文件系统,文件系统块大小为4K bytes,那么硬盘读写的最小单位是:

1. 1 byte

2. 1024 bytes

3. 512 bytes

4. 4096 bytes

5. 1024 bits

Question 46. (多选)

已知如下类定义:

class Base {

public Base (){ //... }

public Base ( int m ){ //... }

protected void fun( int n ){ //... }

}

public class Child extends Base{

// member methods

}

如下哪句可以正确地加入子类中?

1. private void fun(int n){ //...}

2. void fun (int n ){ //... }

3. protected void fun ( int n ) { //... }

4. public void fun ( int n ) { //... }

Question 47. (单选)

It is an important feature of the Java language that it always provides a default constructor to a class.

1. FALSE

2. TRUE

A class contained in a Java program file must have the same name as the file, except for the extension ".java".

1. FALSE

2. TRUE

Question 49. (单选)

Each method in a class must have a unique name.

1. FALSE

2. TRUE

Question 50. (单选)

When an instance of a class, or object, is specified as a parameter to a method, a reference to the said object is passed to the method.

1. FALSE

2. TRUE

Question 51. (单选)

All interface methods must be declared as public when implemented in a class.

1. FALSE

2. TRUE

Question 52. (单选)

Which of the following expressions will produce errors upon compilation?

(A) boolean a = (boolean) 1;

(B) boolean b = (false && true);

(C) float y = 22.3; (D) int x = (25 | 125)

1. (A) & (C)

2. (A)

3. (A), (C) & (D)

4. (A), (B) & (D)

Question 53. (单选)

Which lines of the following will produce an error?

1. byte a1 = 2, a2 = 4, a3;

2. short s = 16;

3. a2 = s;

4. a3 = a1 * a2;

1. Line 3 and Line 4

2. Line 1 only

3. Line 3 only

4. Line 4 only

5. Line 1 and Line 4

Question 54. (单选)

Which keyword can protect a class in a package from accessibility by the classes outside the package?

1. don't use any keyword at all (make it default)

2. private

3. protected

4. final

Question 55. (单选)

Which of the following statements are valid array declaration?

(A) int number();

(B) float average[];

(C) double[] marks;

(D) counter int[];

1. (B) & (C)

2. (A)

3. (A) & (C)

4. (D)

据说是阿里巴巴公司DBA笔试题zz

一:SQL tuning 类

1:列举几种表连接方式

2:不借助第三方工具,怎样查看sql的执行计划

3:如何使用CBO,CBO与RULE的区别

4:如何定位重要(消耗资源多)的SQL

5:如何跟踪某个session的SQL

6:SQL调整最关注的是什么

7:说说你对索引的认识(索引的结构、对dml影响、对查询影响、为什么提高查询性能) 8:使用索引查询一定能提高查询的性能吗?为什么

9:绑定变量是什么?绑定变量有什么优缺点?

10:如何稳定(固定)执行计划

11:和排序相关的内存在8i和9i分别怎样调整,临时表空间的作用是什么

12:存在表T(a,b,c,d),要根据字段c排序后取第21—30条记录显示,请给出sql 二:数据库基本概念类play.bitsCN.com累了吗玩一下吧

1:pctused and pctfree 表示什么含义有什么作用

2:简单描述table / segment / extent / block之间的关系

3:描述tablespace和datafile之间的关系

4:本地管理表空间和字典管理表空间的特点,ASSM有什么特点

5:回滚段的作用是什么

6:日志的作用是什么

7:SGA主要有那些部分,主要作用是什么

8racle系统进程主要有哪些,作用是什么

三:备份恢复类feedom.net国内最早的网管网站

1:备份如何分类

2:归档是什么含义

3:如果一个表在2004-08-04 10:30:00 被drop,在有完善的归档和备份的情况下,如何恢复

4:rman是什么,有何特点

5:standby的特点

6:对于一个要求恢复时间比较短的系统(数据库50G,每天归档5G),你如何设计备份策略

四:系统管理类

bitsCN.com中国网管联盟

1:对于一个存在系统性能的系统,说出你的诊断处理思路

2:列举几种诊断IO、CPU、性能状况的方法

3:对statspack有何认识

4:如果系统现在需要在一个很大的表上创建一个索引,你会考虑那些因素,如何做以尽

量减小对应用的影响

5:对raid10 和raid5有何认识

五:综合随意类

bitsCN.com中国网管联盟

1:你最擅长的是oracle哪部分?

2:喜欢oracle吗?喜欢上论坛吗?或者偏好oracle的哪一部分?

3:随意说说你觉得oracle最有意思的部分或者最困难的部分

4:为何要选择做DBA呢?

阿里巴巴的Oracle DBA笔试题参考答案zz

数据库基本概念类

1:pctused and pctfree 表示什么含义有什么作用

pctused与pctfree控制数据块是否出现在freelist中,

pctfree控制数据块中保留用于update的空间,当数据块中的free space小于pctfree设置的空间时,

该数据块从freelist中去掉,当块由于dml操作free space大于pct_used设置的空间时,该数据库块将

被添加在freelist链表中。

2:简单描述table / segment / extent / block之间的关系

table创建时,默认创建了一个data segment,

每个data segment含有min extents指定的extents数,

每个extent据据表空间的存储参数分配一定数量的blocks

3:描述tablespace和datafile之间的关系

一个tablespace可以有一个或多个datafile,每个datafile只能在一个tablespace内, table中的数据,通过hash算法分布在tablespace中的各个datafile中,

tablespace是逻辑上的概念,datafile则在物理上储存了数据库的种种对象。

4:本地管理表空间和字典管理表空间的特点,ASSM有什么特点

本地管理表空间(Locally Managed Tablespace简称LMT)

8i以后出现的一种新的表空间的管理模式,通过位图来管理表空间的空间使用。 字典管理表空间(Dictionary-Managed Tablespace简称DMT)

8i以前包括以后都还可以使用的一种表空间管理模式,通过数据字典管理表空间的空间使用。

动段空间管理(ASSM),

它首次出现在Oracle920里有了ASSM,链接列表freelist被位图所取代,它是一个二进制的数组,

能够迅速有效地管理存储扩展和剩余区块(free block),因此能够改善分段存储本质, ASSM表空间上创建的段还有另外一个称呼叫Bitmap Managed Segments(BMB 段)。 5:回滚段的作用是什么

事务回滚:当事务修改表中数据的时候,该数据修改前的值(即前影像)会存放在回滚段中,

当用户回滚事务(ROLLBACK)时,ORACLE将会利用回滚段中的数据前影像来将修改的数据恢复到原来的值。

事务恢复:当事务正在处理的时候,例程失败,回滚段的信息保存在undo表空间中, ORACLE将在下次打开数据库时利用回滚来恢复未提交的数据。

读一致性:当一个会话正在修改数据时,其他的会话将看不到该会话未提交的修改。 当一个语句正在执行时,该语句将看不到从该语句开始执行后的未提交的修改(语句级读一致性)

当ORACLE执行Select语句时,ORACLE依照当前的系统改变号(SYSTEM CHANGE NUMBER-SCN)

来保证任何前于当前SCN的未提交的改变不被该语句处理。可以想象:当一个长时间的查询正在执行时,

若其他会话改变了该查询要查询的某个数据块,ORACLE将利用回滚段的数据前影像来构造一个读一致性视图。

6:日志的作用是什么

记录数据库事务,最大限度地保证数据的一致性与安全性

重做日志文件:含对数据库所做的更改记录,这样万一出现故障可以启用数据恢复,一个数据库至少需要两个重做日志文件

归档日志文件:是重做日志文件的脱机副本,这些副本可能对于从介质失败中进行恢复很必要。

7:SGA主要有那些部分,主要作用是什么

SGA:db_cache/shared_pool/large_pool/java_pool

db_cache:

数据库缓存(Block Buffer)对于Oracle数据库的运转和性能起着非常关键的作用,

它占据Oracle数据库SGA(系统共享内存区)的主要部分。Oracle数据库通过使用LRU 算法,将最近访问的数据块存放到缓存中,从而优化对磁盘数据的访问.

shared_pool:

共享池的大小对于Oracle 性能来说都是很重要的。

共享池中保存数据字典高速缓冲和完全解析或编译的的PL/SQL 块和SQL 语句及控制结构

large_pool:

使用MTS配置时,因为要在SGA中分配UGA来保持用户的会话,就是用Large_pool来保持这个会话内存

使用RMAN做备份的时候,要使用Large_pool这个内存结构来做磁盘I/O缓存器 java_pool:

为java procedure预备的内存区域,如果没有使用java proc,java_pool不是必须的 8 oracle系统进程主要有哪些,作用是什么

数据写进程(dbwr):负责将更改的数据从数据库缓冲区高速缓存写入数据文件 日志写进程(lgwr):将重做日志缓冲区中的更改写入在线重做日志文件

系统监控(smon) :检查数据库的一致性如有必要还会在数据库打开时启动数据库的恢复

进程监控(pmon) :负责在一个Oracle 进程失败时清理资源

检查点进程(chpt):负责在每当缓冲区高速缓存中的更改永久地记录在数据库中时,更新控制文件和数据文件中的数据库状态信息。

归档进程(arcn) :在每次日志切换时把已满的日志组进行备份或归档

作业调度器(cjq) :负责将调度与执行系统中已定义好的job,完成一些预定义的工作. 恢复进程(reco) :保证分布式事务的一致性,在分布式事务中,要么同时commit,要么同时rollback;

1.用ext2格式化文件系统,文件系统块大小为4K bytes,那么硬盘读写的最小单位是:

1. 1 byte

2. 1024 bytes

3. 512 bytes

4. 4096 bytes

5. 1024 bits

2.有两台游戏服务器运行于linux 2.6.x内核上,需要同步用户访问日志,你会用下列哪些方法同步日志(开放题:假设权限和条件均可满足)?(多选)

1. rsync

2. wget

3. scp

4. ftp

5. 还有更多(举例说明,正确者加分)

3.在RH Linux观察系统负载状况的常用命令有:

(多选)

1. top

2. vmstat

3. iostat

4. net

4.linux 2.6.* 内核支持的文件系统有:(多选)

1. ext3

2. ext2

3. ext4

4. xfs

5. ufs

5(多选)

在一台2.4.x 内核的linux机器上,下列命令用于检查ipv4的tcp端口监听情况,哪个是对的?

1. netstat -ant|grep LISTEN

2. netstat -an |grep LIST

3. netstat -at | grep LISTEN

4. netstat -a |grep tcp|grep -i listen 5. netstat -a |grep tcp |grep -i listat

kissingwolf

06-10-19, 16:28

1. (4 ) 出题的人好像没说清楚,是硬盘传输i/o还是磁头硬件i/o !

2. 全选,额外还有smb共享,nfs 共享,http 共享 ,syslog传输方式,xinetd 自编程方式,其实只要是权限没有要求,不就是个文件共享吗?

3. 除了net ! 这个是linux for CIFS server的工具。

4.除了ext4 ,这个还是试验性的,你可以在/{your_kernel_src}/fs/里看看,支持的文件系统都在这里!

5.除了netstat -a |grep tcp |grep -i listat ,其他都可以, -a 是所有信息,-n 不做ip->name的解析,-t tcp

阅读详情:http://www.wenku1.com/news/51E04C7607C56665.html

范文三:阿里巴巴笔试

阿里巴巴笔试记

2008-10-1021:25

考点(不分先后次序):

C++:1.关于DOM的描述;2.网络蜘蛛系统;3.UTF-8;4.数据库检索:查准率和查全率;5.索引压缩;6.设计cralwer;7.Trie树查询;8.HTML&HTTP协议;9.信息检索模型;10.分布式通信协议;11.分布式搜索引擎;12.双向循环链表;13.快速排序;14.32位系统。

1.关于DOM的描述:

javascrip里面的dom(文档对象模型)它是一种模型,将格式化文档对象化处理。在xml和html的处理中广泛应用。//dom是定义超文本结构的对象及方法,分层次的,有容器类的对象,也有基本元素对象,而这些对象,都包含有相应的属性和对应的操作方法(接口)。

//一般而言,DOM结构准确地反映了HTML文档所包含的内容,也就是说,每个HTML标记表现为一个标记节点(tagnode),每个文本项内容表现为一个文本项节点(textnode)。//是W3C组织推荐的处理可扩展置标语言的标准编程接口。

2.网络蜘蛛系统

网络蜘蛛即WebSpider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。

对于搜索引擎来说,要抓取互联网上所有的网页几乎是不可能的,从目前公布的数据来看,容量最大的搜索引擎也不过是抓取了整个网页数量的百分之四十左右。这其中的原因一方面是抓取技术的瓶颈,无法遍历所有的网页,有许多网页无法从其它网页的链接中找到;另一个原因是存储技术和处理技术的问题,

在抓取网页的时候,网络蜘蛛一般有两种策略:广度优先和深度优先(如下图所示)。广度优先是指网络蜘蛛会先抓取起始网页中链接的所有网页,然后再选择其中的一个链接网页,继续抓取在此网页中链接的所有网页。这是最常用的方式,因为这个方法可以让网络蜘蛛并行处理,提高其抓取速度。深度优先是指网络蜘蛛会从起始页开始,一个链接一个链接跟踪下去,处理完这条线路之后再转入下一个起始页,继续跟踪链接。这个方法有个优点是网络蜘蛛在设计的时候比较容易。两种策略的区别,下图的说明会更加明确。

在网络蜘蛛机器人系统里面,真正起指挥作用的是人工管理系统制定的规则和检索索引数据库。它可以决定什么样的网站抓的勤一点,或者干脆不抓.

3.UTF-8

使用UTF-8编码唯一的好处是,国外的用户如果使用WindowsXP英文版,浏览UTF-8编码的任何网页,无论是中文、还是日文、韩文、阿拉伯文,都可以正常显示,UTF-8是世界通用的语言编码,UTF-8的推广要归功于Google的应用,以及Blog开发者。而如果用WindowsXP英文版的IE6.0浏览gb2312语言编码的网页,则会提示是否安装语言包。因此,可能会失去很多的国外浏览者。使用gb2312编码的好处是,因为程序产生的网页文本使用ANSI编码格式,会比UTF-8文本编码节省一些体积,访问速度会稍微快一点点,大约是30:38的比例,也就是30K的ANSI编码,转为UTF-8编码是38K,当然,这个比例并不准确,是会随Unicode字符集区域的不同而变化的。

UTF-8(8位元UniversalCharacterSet/UnicodeTransformationFormat)是针对Unicode的一种可变长度字符编码。它可以用来表示Unicode标准中的任何字符,而且其编码中的第一个字节仍与ASCII相容,使得原来处理ASCII字符的软件无需或只作少部份修改后,便可继续使用。因此,它逐渐成为电子邮件、网页及其他储存或传送文字的应用中,优先采用的编码。UTF-8编码提供了一种简便而向后兼容的方法,使得那种完全围绕ASCII设计的操作系统,比如Unix,也可以使用Unicode.UTF-8.UTF_8字符集

UTF-8是UNICODE的一种变长字符编码,由KenThompson于1992年创建。现在已经标准化为RFC3629。UTF-8用1到6个字节编码UNICODE字符。如果UNICODE字符由2个字节表示,则编码成UTF-8很可能需要3个字节,而如果UNICODE字符由4个字节表示,则编码成UTF-8可能需要6个字节。用4个或6个字节去编码一个UNICODE字符可能太多了,但很少会遇到那样的UNICODE字符

4.数据库检索:查准率和查全率;

查全率与查准率是评价检索效果的两项重要指标。

查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。

查全率=[检出相关文献量/文献库内相关文献总量]×100%

查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。

查准率=[检出相关文献量/检出文献总量]×100%

通过对查准率和查全率的概念分析,得到了定性的结论:查全率依赖于查准率,查准率的提高有利于查全率的提高。通过对两者间关系的数学推导,得到了查准率和查全率之间一般性的定量关系。

5.索引压缩

建立索引是搜索引擎核心技术之一,建立索引的目的是能够快速的响应用户的查询。搜索引擎最常用的索引数据结构是倒排文档,倒排文档的原理其实相当简单。为什么要进行索引压缩?对索引进行压缩有很多好处:比如可以减少索引占用的磁盘空间和内存;比如可以减少I/O读写量;比如可以查询响应速度加快;为了能够增加压缩效果,一般在进行压缩前先改写索引内容,首先把倒排索引的数值按照大小排序,然后用差值而非实际值表示(d-gap);这个是每个压缩算法开展前要做的工作;目前的压缩方法可以分为固定长度的和变长压缩。

具体说是将索引编码(落实到机器中应该是MD5哈希值)以一种压缩的方式来表示,既利于节省存储空间,又可以提高检索速度。其实,我觉得这个东西最大的好处还是节约“缓存空间”,提高访问速度。采用索引压缩能够带来很多好处,所以实用的搜索引擎都会采用索引压缩技术,但是对索引进行压缩也会带来问题,就是比不压缩需要更多的计算量.

6.设计cralwer

搜索引擎的工作整体上可分为三个部分,在第一阶段,Crawler开始“爬行”页面,获取最原始信息,Crawler是一段小程序,它通过初始地址,访问页面,分析出页面内部包括的链接,将链接传送给Crawler控制模块,Crawler控制模块判断哪些链接对应的页面是下一步需要访问的,哪一些是已经被访问过的,从而指示Crawler进行下一步“爬行”;另一方面,Crawler将获取到的Web页面传送到页面数据存储库(PageRepository)中,临时存储起来。第二阶段,索引器将库中存储的页面进行解析,根据索引构建原则创建索引,并将索引存储到索引库中,另外,在一些基于页面链接对页面进行排名的搜索引擎系统中,链接分析与页面排名的确定也在这个阶段完成。第三阶段,检索引擎处理用户的搜索请求,找

出相关页面文档,并根据页面排名高低,按顺序将结果返回给用户。三个阶段并行协同工作,维持搜索引擎的正常运转

爬行器技术:爬行器(Crawler,Spider)又叫“爬虫”、“蜘蛛”,工作在搜索引擎的最前端,是搜索引擎中最关键的部分之一,它的性能好坏直接影响到搜索引擎对于页面信息的采集与更新。Internet上的网页可以通过链接进行互访,这使得Crawler可以从初始URL出发,沿着链接导向,遍历Internet上整体网页构成的连通图。即使整体页面构成的图不是完全连通的,也可以将Internet上的页面集合看成是一个个连通的子图构成的,多个Crawler选择合理的起点,顺着页面链接进行爬行,也能遍历完整个图。考虑到网络上Web页面的数量非常庞大,设计一个性能良好的爬行器需要考虑以下4个问题[10]:1.应下载哪些页面?在多数情况下,Crawler并不下载Web上的所有页面,即使是最复杂的搜索引擎,其索引库中能检索到的页面也只占整个Web总页面的一小部分。所以,Crawler优先选择最“重要”的页面进行下载非常重要,以保证下载的部分更有价值。2.如何更新页面?一旦Crawler下载了大量的页面,它会周期性的访问原始页面地址,看其是否是更新过的。Web上的页面内容可能变化非常快,Crawler必须决定以不同的频率访问不同的页面。

3.如何降低被爬行站点的负载?当Crawler获取页面时,需要消耗部分被访问服务器的资源,同时也占用网络带宽,增加了网络负担。Cralwer应使用相应的策略降低这些消耗,否则相应站点将禁止Cralwer去访问其页面。4.如何并行化爬行过程?由于要爬行的页面数量非常大,一个Crawler在一定时间内,通常不能胜任爬行所有页面的能力,必须使用多个Crawler来完成这一工作。因此,Crawler之间的并行协同工作显得非常重要。

针对Crawler工作任务的重要性及其工作量的巨大,许多搜索引擎采用了分布式Crawler技术,但是如何将巨大的爬行任务均衡地分配给各个Crawler是分布式WebCrawler的关键问题之一。目前许多Crawler系统都采用了集中式的任务分割策略

7.Trie树查询

基于三数组Trie索引树原理的汉语词典查询机制,并用递归算法实现构词状态表的自动构建.Trie树是搜索树的一种,来自英文单词"Retrieval"的简写,可以建立有效的数据检索组织结构,是中文匹配分词算法中词典的一种常见实现。它本质上是一个确定的有限状态自动机(DFA),每个节点代表自动机的一个状态。在词典中这此状态包括"词前缀","已成词"等。Trie树就是字典树,其核心思想就是空间换时间.字典树有如下简单的性质:

(1)根节点不包含字符信息;

(3)一棵m度的Trie或者为空,或者由m棵m度的Trie组成。

搜索字典项目的方法为:

(1)从根结点开始一次搜索;(2)取得要查找关键词的第一个字母,并根据该字母选择对应的子树,转到该子树继续进行检索;

(3)在相应的子树上,取得要查找关键词的第二个字母,并进一步选择对应的子树进行检索。

4)迭代过程……

(5)在某个结点处,关键词的所有字母已被取出,则读取附在该结点上的信息,即完成查找。双数组Trie(Double-ArrayTrie)是trie树的一个简单而有效的实现,由两个整数数组构成,一个是base[],另一个是check[]。设数组下标为i,如果base[i],check[i]均为0,表示该位置为空。如果base[i]为负值,表示该状态为词语。Check[i]表示该状态的前一状态,t=base[i]+a,check[t]=i。

8.HTML&HTTP协议

HTML(HyperTextMark-upLanguage)即超文本标记语言,是WWW的描述语言,由TimBerners-lee提出。设计HTML语言的目的是为了能把存放在一台电脑中的文本或图形与另

一台电脑中的文本或图形方便地联系在一起,形成有机的整体,人们不用考虑具体信息是在当前电脑上还是在网络的其它电脑上。这样,你只要使用鼠标在某一文档中点取一个图标,Internet就会马上转到与此图标相关的内容上去,而这些信息可能存放在网络的另一台电脑中。HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字、图形、动画、声音、表格、链接等。HTML的结构包括头部(Head)、主体(Body)两大部分。头部描述浏览器所需的信息,主体包含所要说明的具体内容。

HTTP协议(HypertextTransferProtocol,超文本传输协议)是用于从WWW服务器传输超文本到本地浏览器的传送协议。它可以使浏览器更加高效,使网络传输减少。它不仅保证计算机正确快速地传输超文本文档,还确定传输文档中的哪一部分,以及哪部分内容首先显示(如文本先于图形)等。超文本传输协议(HTTP)是一种为分布式,合作式,多媒体信息系统服务,面向应用层的协议。它是一种通用的,不分状态(stateless)的协议,除了诸如名称服务和分布对象管理系统之类的超文本用途外,还可以通过扩展它的请求方式,错误代码和报头[47]来完成许多任务。HTTP的一个特点是数据表示方式的典型性和可协商性允许独立于传输数据而建立系统。

9.信息检索模型;

信息检索的数学模型

合模型

络模型2.1信息检索系统的形式化表示2.2集合论检索模型2.2.1布尔检索模型2.2.2模糊集2.3.3神经网2.2.3扩展布尔模型2.3代数论检索模型2.4概率论检索模型2.4.1经典概率模型2.3.1向量空间模型2.3.2潜在语义索引模型2.4.2基于Bayesian网络的检索模型2.5其他信息检索模型与数学理论2.5.1结构化检索模型2.5.2浏览模型2.5.3其他新型数学理论提出了一种基于本体语义模型的信息检索方法。该方法充分利用领域本体提供的概念之间的语义相关性,从语义模型扩展、概念相似度、相关度计算,并以用户反馈等角度探讨了基于语义模型的自动推理方法在信息检索中的应用,文章介绍了系统实现框架.包括布尔检索模型、向量空间模型和概率检索模型在内的信息检索数学模型.

10.分布式通信协议;

分布式虚拟环境(DVE)中高速运动实体的状态更新数据量很大,对实时性要求高,现有的通讯协议不支持消息废除,因而不能很好地支持新的状态更新消息覆盖过时消息。文章提出了一种可更新队列的概念模型,在此基础上提出了一种新的协议方案,它支持过时消息的丢弃,更好地满足了实时交互的需要。分布式实时数据库系统必须能够处理具有时间限制的应用,而这些应用所涉及的某些数据又不在应用本地,所以不可避免地要与网络上的其它结点进行通讯,传送数据或消息.在分布式实时数据库系统中,不仅要求数据值正确,而且具有时间限制,即在规定的时间内,值正确的数据才是有效的.所以,实时通讯中,不仅要求数据或消息传送正确,而且要尽可能保证或必须保证数据或消息在应用可允许的时间范围内完成传送.

11.分布式搜索引擎

分布式搜索引擎是根据地域、主题、IP地址及其它的划分标准将全网分成若干个自治区域,在每个自治区域内设立一个检索服务器,而每个检索服务器由信息搜索机器人、索引搜索软件数据库和代理三部分组成。信息搜索机器人负责本自治区域内的信息搜索,并建立索引信息存入索引数据库。代理负责向用户提供查询接口,并与其它代理进行互换,实现检索服务器之间的信息交换,且查询可以重定向,即如果一个索引数据库没有满足查询要求,它可以将查询请求发送到其它检索服务器上。它与集中式搜索引擎相比有以下优点:各检索服务器之间相互共享资源,站点只向本自治区域内的信息搜索机器人提供信息,减轻了网络及各站点的负载。各代理之间的相互协作

及查询重定向使得提供的服务更完善。与Web本身的分布式特性相适应,具有良好的可扩充性,便于维护。索引信息划分到各自的索引数据库中,使得各索引数据库相对较小,查询的响应时间相对较短。部分检索服务器发生故障时,其它部分能正常工作。Web服务器集群是一种典型的分布式处理系统。所谓Web集群就是采用高速网络,将原来独立的若干个服务器联结起来,作为一个整体提供服务,把到达的请求分配到集群中的各个后台服务器上,让它们分摊负载及I/O,通过并行处理提高性能。此时涉及到请求分配器及负载平衡的技术问题。开发垂直门户的分布式搜索引擎系统时,发现有四种不同应用的分布式搜索引擎:1.分布式元搜索:2.散列分布搜索引擎3.Peer2peer搜索引擎4.局部遍历型搜索引擎.分布式元搜索:14.32位系统

32位系统指机内数据长度,指令长度,地址长度是二进制32位。64位系统指机内数据长度,指令长度,地址长度是二进制64位。64位系统速度快。32位系统系统要寻高于32位的地址就要用到复杂一点的运算,用两个32位单元组合成(好几步才能到位)。64位系统直接寻址(一步到位)。

JAVA:1.Servlet中怎样控制页面在客户端的缓存策略;2.执行存储过程;3.JSP;

4.Thread.wait()可否设置超时;5.注释XML内容:CDATA;6.IOC;7.Open-Closed原则含义;8.JUnitTestCase基类中的代码;9.javax.servle.http.HttpServlet;10.JDBC连接池&功能;11.XMLSchema:&;12.领域模型;13.Servlet生命周期。

还有综合类的,就有点类似公务员考试的题目,还有一些关于计算机的题目,例如考点:

1.软件测试的对象;2.用户进程的跟踪信息存在于什么目录;3.how使普通用户可执行超

级用户文件;4.向有限空间输入超长字符串是什么攻击,等等。大题就两道:1.隐马尔科夫模型(HMM)的3个基本问题;2.(写函数的)。其实看到这些题目,我就蒙了,有些根本就没见过。但是别怕,是否做出这些题目,并不是他们是否选择你的标准(我觉得),都是摸一下底而已。我相信,大部分的人都是做不出来的,里面涉及的知识点,也不是全能从课本学来,靠的是积累。当然,这些也只是我个人的看法,因为我也没过这个笔试,不过我觉得我还是有收获的。这是我第一个参加的笔试,重在过程,所以我列下了这两个方向的考点,可能还是有点参考价值吧!

2.隐马尔科夫模型(hiddenMarkovmodel,缩写为HMM)的提出最初是在语音处

理领域。HMM是在Markov链的基础上发展起来的一种统计模型。由于实际问题比Markov链模型所描述的更为复杂,因此在HMM中观察到的事件与状态并不是一一对应,而是与每个状态的一组概率分布相联系。它是一个双重随机过程,其中之一是Markov链,描述状态的转移;另一个描述每个状态和观察值之间的统计对应关系。这样,HMM以概率模型描述观察值序列,具有很好的数学结构,能够比较完整地表达观察值序列的特征。

阅读详情:http://www.wenku1.com/news/4A50C7E2C8F18919.html

范文四:阿里巴巴笔试

用一整个数形实现组一个固有上界为100定的堆个栈,现实pus,poh,pize方法s并编代写码堆栈进行对能功试,语测使言用avJaC,或C#++均可

一个有g

eneirc的定上固的堆栈,c界las stSackT> {

义b定roa dmacht一个,组词单词的如果是一个另词单组词的集,就子认为是个brod maatch,例如于对"a b c ,"a"" ,b" c"" ca "a b"c "都匹配而,"a d 不匹"配现。有一个索搜配模块匹输,入为户用的询查来配匹一词组个字,找典到典中所字可以和有入bro输ad atch的词组m输,预出定的组整词型序。号如例ch"apei ponhei china",字n典有 1. "中chep aphone"i ,.2" chae pmoibel" , "ch3ian piohen",1则3和配。设计匹性测能试报告语言描(述)以完描整述述被测块模的能,性例如不限但于"性 曲能y反映查询线速度相x对变,化其他变不的查时速度询,单x位为xU,y单位为Uy"

为了便方车一有族预约汽车保养务服天猫,汽和主车厂商机作合,将全国千数4家s的汽店保养服车务到搬上网开放给,户用进行预约,户可以用根据己自的闲时间暇前预提约汽车养服保务可享有优并价惠。格假设个某牌品汽车的机主厂商在天上猫布发一个了车保养服务商汽品,这商品有个个7餐套每,个套餐价格不的,每同个套每餐天可提供服的务量是定的一(比如每每个天提店5辆次的供餐套类A型汽车保养服的务),全一国有共5001家s4店,用最多可户提前一个月(3天0进行)约下单。如预果由你来计这设个车汽养服保务商的品系,你统算打么怎做

*?根请据面向对原理象计设出品商模,型时同说设明计思路,最能好阐发明布商品编辑、商品和易交单下场等景的体具逻。辑

双十一的时候很人多提前都在物车购中收了想买的商品藏,到等点0一就批量下单,键假购物设清车如下单:

*请编写

键一批量单下主要逻的辑代码0(点量流很,适当考虑大能)性

用Jaa代码模v拟实现:个人一断往不子箱里苹放,果一另人不断从箱个里子取果苹,箱只子放能5个苹果,果数苹无限量要求不使。j用vaa.tuli.cncuorern包中的t类。

阅读详情:http://www.wenku1.com/news/56BD606CBBE8B406.html

范文五:阿里巴巴笔试题

下列不属于hash碰撞解决方法是______。

线性探测

单旋转法@

二次探测

拉链法

双重散列

多重散列

在32位操作系统中,下列类型占用8个字符的为______。

short int

int C long

unsigned int

long long@

char

int

下列C代码中,不属于未定义行为的有:______。

int i=0; i=(i++);

char *p="hello"; p[1]='E';

char *p="hello"; char ch=*p++;

int i=0; printf("%d %d\n",i++,i--);

都是未定义行为

都不是未定义行为@

每台物理计算机可以虚拟出20台虚拟机,假定一台虚拟机发生故障当且仅当它所宿主的物理机发生故障。通过5台物理机虚拟出100台虚拟机,那么关于这100台虚拟机的故障的说法正确的是:______?

单台虚拟机的故障率高于单台物理机的故障率。

这100台虚拟机发生故障是彼此独立的。

这100台虚拟机单位时间内出现故障的个数高于100台物理机单位时间内出现故障的个数。

无法判断这100台虚拟机和100台物理机哪个更可靠。

如果随机选出5台虚拟机组成集群,那么这个集群的可靠性和5台物理机的可靠性相同。

可能有一段时间只有1台虚拟机发生故障。

有4个进程A、B、C、D,设它们依次进入就绪队列,因相差时间很短可视为同时到达。4个进程按轮转法分别运行11,7,2和4个时间单位,设时间片为1。四个进程的平均周转时间为______。

15.25

16.25

16.75 @

17.25

17.75

18.25

已知一个二叉树的前序遍历结果是(ACDEFHGB),中序遍历结果是(DECAHFBG),请问后序遍历结果是______。

HGFEDCBA

EDCHBGFA

BGFHEDCA

EDCBGHFA

BEGHDFCA

BGHFEDCA

在小端序的机器中,如果

union X{

int x;

char y[4];

};

如果:

X a;

a.x=0x11223344;//16进制

则:______

a.y[0]=11

a.y[1]=11

a.y[2]=11

a.y[3]=11

a.y[0]=22

a.y[3]=22

使用一辆卡车运输n块单块1TB装满数据的硬盘,以时速80km/h行驶1000km将数据运送到目的地;卡车至少运送______块硬盘才能使传输速率超

1000Gbps。

2000

3000

4000

5000

6000

7000

若路由器接收的IP报文的目的地址不是路由器的接口IP地址,并且未匹配的路由项,则采取的策略是______。

丢掉该分组@

将该分组分片

转发该分组

将分组转发或分片

将分组保留存储

以上都有可能

下列方法中,______不可以用来程序调优 ?

改善数据访问方式以提升缓存命中率

使用多线程的方式提高I/O密集型操作的效率

利用数据库连接池替代直接的数据库访问

使用迭代替代递归

合并多个远程调用批量发送

共享冗余数据提高访问效率

下面的函数中哪个是系统调用而不是库函数______?

printf

scanf

fgetc

read@

print_s

scan_s

H同学每天乘公交上学,早上睡过头或遇到堵车都会迟到;H早上睡过头概率为0.2,路上遇到堵车概率为0.5;若某天早上H迟到了,那么以下推测正确的有______。

今天H早上睡过头了

今天H早上睡过头的概率为0.2

今天H早上睡过头的概率大于0.2

今天H早上遇到堵车了

今天H早上遇到堵车的概率为0.5

今天H早上遇到堵车的概率小于0.5

甲乙两路发车间隔均为10分钟的公交车发车时刻分钟数个位分别为1和9,那么对于一个随机到达的乘客,ta乘坐甲车的概率为:

0.1

0.2

0.3

0.4

0.5

0.9

对立的两方争夺一个价值为1的物品,双方可以采取的策略可以分为鸽子策略和鹰策略。如果双方都是鸽子策略,那么双方各有1/2的几率获得该物品;如果双方均为鹰策略,那么双方各有1/2的概率取胜,胜方获得价值为1的物品,付出价值为1的代价,负方付出价值为1的代价;如果一方为鸽子策略,一方为鹰策略,那么鹰策略获得价值为1的物品。在争夺的结果出来之前,没人知道对方是鸽子策略还是鹰策略。那么以下说法正确的是:______?

如果选择鸽子策略的人多于2/3,那么你应该选择鸽子策略。

如果选择鸽子策略的人少于1/3,那么你应该选择鸽子策略。

选择鸽子策略的人越多,你越应该选择鸽子策略。@

如果选择鹰策略的人多于2/3,那么你应该选择鹰策略。

如果选择鹰策略的人少于1/3,那么你应该选择鸽子策略。

以上结论都不对。

19:36:09

村长”带着5对父子参加“爸爸去哪儿”第三季第二站某村庄的拍摄。村里为了保护小孩不被拐走有个千年的规矩,那就是吃饭的时候小孩左右只能是其他小孩或者自己的父母。那么5对父子在圆桌上共有______种坐法。(旋转一下,每个人面对的方向变更后算是一种新的坐法)

960

3120

2400

7200

7440

9600

下列描述中,唯一错误的是______。

本题有五个选项是正确的

B正确

D正确

DEF都正确

ABC中有一个错误

如果ABCDE都正确,那么F也正

附加题

1、

写一个函数,输入一个二叉树,树中每个节点存放了一个整数值,函数返回这棵二叉树中相差最大的两个节点间的差值绝对值。请注意程序效率。

答案1、nt min,max=0;

//初始化min,max

void init(BT *bt){

//初始化min,max

if(head!=NULL){

min = head->data;

max = min;

}

}

//用于计算最大最小值差的函数

//函数返回最大最小值差的绝对值

int find(BT *bt){

BT *head = bt;

//中序遍历,并求得最大、最小值

while(head!=NULL){

find(head-lchild);

if(min>head->data){

min = head->data;

}

if(maxdata){

max = head->data;

}

find(head->rchild);

}

return (max-min);

}

答案2#include

#include

#include

#include

typedef struct TREE_NODE

{

int value;

struct TREE_NODE *left;

struct TREE_NODE *right;

}TreeNode;

static TreeNode *tree;

void

insert(int value)

{

TreeNode *current;

TreeNode **link;

link = &tree;

while((current = *link) != NULL){

if(value value)

link = ¤t->left;

else{

assert(value != current->value);

link = ¤t->right;

}

}

current = (TreeNode *)malloc(sizeof(TreeNode));

assert(current != NULL);

current->value = value;

current->left = NULL;

current->right = NULL;

*link = current;

}

int

main(void)

{

int i;

int value;

for(i = 0; i

{

printf("input the %d value:",i+1);

scanf("%d",&value);

getchar();

insert(value);

}

TreeNode *leftnode = tree;

while(leftnode->left != NULL)

{

leftnode = leftnode->left;

}

int small = leftnode->value;

TreeNode *rightnode = tree;

while(rightnode->right != NULL)

{

rightnode = rightnode->right;

}

int max = rightnode->value;

printf("%d\n",max-small);

return 0;

}

2、测试类

如果让你来测试淘宝站内的搜索系统,请问你能想到哪些方法来进行测试?我们假设淘宝网的搜索入口页面如下图所示:

图片:淘宝首页搜素系统

答案:1、文字测试——此搜索系统文字可以看做软件文档,可以用测试文档的方法进行测试,检查术语,内容,准确度,特别是可能过期的产品,例如(1)输入的文字内容:衣服,食品等;(2)文字的输入法:中文,英文等

2、链接测试——它是在界面之间进行切换和指导用户去一些未知页面,分为3个方面:(1)测试所有链接是否按指示的那样确实链接到了该链接的页面(2)测试所链接的页面是否存在(3)保证系统上没有孤立的页面,即没有链接指向该页面,例如:该系统有两个主要的链接:宝贝,店铺

3、图形测试——可以包括图形、按钮等,图形测试的内容有:(1)确保图形有明确的用途,图片的大小和质量也是一个重要的元素,一般采用JPG或GIF压缩

(3)检测所有的图片是否都正确载入和显示

4、动态内容测试——根据当前条件发生变化的文字和图形的测试,如:日期、时间、用户爱好、具体的用户操作等。

5、服务器性能和加载测试——每一次点击都要从系统的服务器下载数据到浏览器的计算机。

6、安全性测试——主要设计的内容有:(1)该系统是否有超时的限制(2)服务器端的脚本是否构成威胁,以及在服务器端放置好编辑脚本的问题 20:48:40

3、给定一个query和一个text,均由小写字母组成。要求在text中找出以同样的顺序连续出现在query中的最长连续字母序列的长度。例如, query为“acbac”,text为“acaccbabb”,那么text中的“cba”为最长的连续出现在query中的字母序列,因此,返回结果应该为其长度3。请注意程序效率。 答案:public class Main {

public static void main(String[] args) {

String query = "acbac";

String text = "acaccbabb";

l: for (int i = query.length(); i > 0 ; i--) {

for (int j = 0; j

if (text.contains(query.substring(j,i-j))) {

System.out.println(query.substring(j,i-j).length());

break l;

}

}

} } }

阅读详情:http://www.wenku1.com/news/E1C08EA67DA7E8E9.html

范文六:阿里巴巴2014笔试

阿里巴巴 2014 校招笔试题-2013 年 9 月 14 日

分类: 算法与数据结构 程序员笔试面试 2013-09-14 23:00 9123 人阅读 评论(76) 收藏 举报 阿里巴巴校园招聘北京

不得不吐槽,阿里真是太混乱了,北京的笔试在考场等了两个半小时,考卷都没运到考场, @阿里巴巴集团校园招聘回应说:“北京的同学们,简单解释下,为了试卷的保密,印刷的 时间都比较晚,结果出意外了。”还是没考成,现在其他城市的笔试结束了,有同学分享了 试卷,就来做做吧, 这套题不知道是哪个城市的,也不清楚不同的城市笔试题是不是一样。。。 图片内容来源于网络,答案自己做的。 ------------------------------------------------------

(www.wenku1.com)1-5: C A C B C 6-7: D C

8-9: C A

(www.wenku1.com)10: B 11-12: A D

(www.wenku1.com)13-15: A B C 13 题:出现 10 的概率为 P(1024 分之 1),已经出现 10 了,求期望应该就是 P 的倒数吧 1024 14 题:如果^表示异或则值为 2,如果^表示幂则值为 1

(www.wenku1.com)16-18: C B A

(www.wenku1.com)19-20: B B 21-24: ABD ABC D ABCD 19: 第一种颜色涂 0 个球:1 第一种颜色涂 1 个球:1 第一种颜色涂 2 个球:3 第一种颜色涂 3 个球:4 第一种颜色涂 4 个球:3 第一种颜色涂 5 个球:1 第一种颜色涂 6 个球:1

22、 三个数分别代表不同时间段的系统平均负载 D (一分钟、 五分钟、 以及十五分钟) 它们的数字当然是越小越好。 , 数字越高, 说明服务器的负载越大,这也可能是服务器出现某种问题的信号。但是一分钟和五分钟的平均负载大于十五分钟的,不是负载 在变小吧。

答案:a+b*c-d-e/f

(www.wenku1.com)答案: 26 题:直接命中的次数是 3 次,分别是访问 1,5,1,3,5,2,4,1,2 时。最后缓存中 即将准备淘汰的数据项是 5 27 题:node in a 并且 node in b,就是求两个链表的公共节点吧

(www.wenku1.com)就是先分别遍历一遍链表 A 和链表 B,在遍历时分别记下链表 AB 的长度,并且在最后看看 链表 A 和链表 B 的最后一个节点是不是相同,如果相同则有公共节点,如果不同就没有公 共节点。 找公共节点就是再利用两个指针,根据遍历时记录的长度,找到第一个公共节点,这个节点 后面的就都是公共节点了。 28 题:p %= N; 29 题:4 场。分析见下图:箭头表示一场红对蓝的比赛,()表示 A 对 B 红对蓝 一场,B 对 A 红对蓝一场,带黑点的表示重复了一场比赛,具体的 4 场比赛见右边的 4 个 图。

(www.wenku1.com)分享到: 上一篇:leetcode_question_63 Unique Paths II 下一篇:leetcode_question_72 Edit Distance

7

0 查看评论 34 楼 Weirenren_027 6 天前 10:52 发表 [回复]

第 14 个选择题答案应该是 2 吧而不是 1 传参为 26 33 楼 monsion 2013-09-28 11:08 发表 [回复]

21 题是 ABCD,CPU 有内在优化机制,不相关的两条语句

可能倒过来执行,见《程序员的自我 修养》,原题 32 楼 HEVC_CJL 2013-09-24 17:13 发表 [回复]

请问第一题的 D 为什么不对? 31 楼 Tmac_shamgod 2013-09-23 14:26 发表 [回复]

楼主这是研发试卷还是算法试卷,昨天去做了南京站的研发 30 楼 Monday2204 2013-09-22 16:21 发表 [回复]

21 题,应该选 ABD,r1,r2 是局部变量,只有运行才有值,运行了,就不可能为 0 29 楼 fhljys 2013-09-22 14:20 发表 [回复]

28 题错了,应该用乘法散列法,参考算法导论书,个人觉得应该是 P = P mod(2^32)>> (32-lgN) 28 楼 __张小黑 2013-09-22 12:27 发表 [回复]

(www.wenku1.com)第三题应该是 B,不是增加寻址空间,是增加指令数量。 C 是对的,目前的 CPU 主频可以很高是通过增加流水深度带来的。没有流水线跑 100MHz,如 果换成三级流水,同样时钟节拍下是 300MHz 主频。 27 楼 messishow 2013-09-21 23:17 发表 [回复]

第 24 题怎么做,求分析 Re: donshing 2013-09-22 12:53 发表 [回复]

回复 messishow:网上搜搜怎么得到 rand49,得到 49 后,比他小的都可以得到,问题解决 Re: __张小黑 2013-09-22 12:24 发表 [回复]

回复 messishow:A (ran7+ran7+ran7)%3 B ran7+ran7+ran7 CD 同理 A Re: donshing 2013-09-22 12:52 发表 [回复]

回复 xtayyt:这样的话,有的数字的出现都有两种以上的组合,不是这样得到的。 Re: __张小黑 2013-09-24 11:34 发 表 [回复]

回复 donshing:你说的对,我欠考虑了。 http://blog.csdn.net/wzy_1988/article/details/11866973 这个地址有给出详细的解答。 Re: donshing 前天 16:45 发表 [回复]

回复 xtayyt:哎,被阿里鄙视了啊,你们加油吧 26 楼 messishow 2013-09-21 23:15 发表 [回复]

第 24 题怎么做?求分析??

(www.wenku1.com)25 楼 dcc870266923 2013-09-21 21:43 发表 [回复]

14 题必是 2 24 楼 zhk7894613 2013-09-21 21:35 发表 [回复]

25 题有问题,正确的结果应该是:a+b*(c-d)-e/f.楼主认为呢? 23 楼 bulletnoid 2013-09-21 19:43 发表 [回复]

14 题选 C,妥妥的 ^ 在平时打字时多用来表示幂 作为操作符来说这玩意可是表示异或的啊 T _ T 写个程序跑跑就知道了...... Re: bulletnoid 2013-09-21 20:34 发表 [回复]

回复 bulletnoid:很多科学型计算器上幂也用的是 ^ 表示的;13 题里也有一个; (阿里偷笑……搞死你们丫的……) Re: bulletnoid 2013-09-21 19:59 发表 [回复]

回复 bulletnoid:14 题阿里太坏了,还故意给个 2 ^ 31,好让骚年们都以为这是幂; 可以说脏话么...... Re: doc_sgl 2013-09-21 20:53 发表 [回复]

回复 bulletnoid:2^31 表示的是 32 位有符号 int 的最小的数,也不难算,其实在这里按题意 应该是幂的 Re: bulletnoid 2013-09-21 21:00 发 表 [回复]

回复 doc_sgl:如果 foo(2^31 - 3)算是一段程序的话那不就成异或了…… Re: doc_sgl 2013-09-2 1 21:03 发表 [回复]

(www.wenku1.com)回复

bulletnoid:对,我也跑过 22 楼 bulletnoid 2013-09-21 19:19 发表 [回复]

18 题的 A 不对,应该选最直接最暴力的 D (1 2 3) (2 3 1) (3 1 2) 每个数出现在不同位置上的概率相等,但这玩意明显不独立......(受到循环群启发了) Re: Aselan 2013-09-21 21:27 发表 [回复]

回复 bulletnoid:的确 21 楼 bulletnoid 2013-09-21 19:10 发表 [回复]

13 题应该是 A 1024 出现 1 的概率是 1/(2^1) 出现 2 的概率是 1/(2^2) ... 出现 10 的概率是 1/(2^10) 若出现 1 个 10,则平均出现: (2^1) = 2 个 9 ... (2^8) = 256 个 2 (2^9) = 512 个 1 一共 1024 个 Re: bulletnoid 2013-09-21 20:35 发表 [回复]

回复 bulletnoid:注:^ 在这里表示幂; (差点被阿里搞死......) 20 楼 bulletnoid 2013-09-21 18:56 发表 [回复]

楼主,23 题是选错误的吧~选反了~ Re: doc_sgl 2013-09-21 20:50 发表 [回复]

回复 bulletnoid:已改正

(www.wenku1.com)19 楼 代码与单车 2013-09-21 18:19 发表 [回复]

http://blog.csdn.net/yellowxz/article/details/11878019 链表求公共节点的解法。 18 楼 Jocodeoe 2013-09-21 17:43 发表 [回复]

还有 22 题的 A 选项,你确定是正确的吗? Re: bulletnoid 2013-09-21 20:17 发表 [回复]

回复 Jocodeoe:A 是对的 就绪表示进程除了 CPU 以外所有的资源都具备了; 如果认为 CPU 是有求必应的话,就绪/运行的比值越高则表明系统负荷越大; 负荷的表述这里有形象的解释 http://www.ruanyifeng.com/blog/2011/07/linux_load_average_explained.html 17 楼 Jocodeoe 2013-09-21 16:51 发表 [回复]

18 题选 A 可以解释一下吗?D 为何不可? Re: bulletnoid 2013-09-21 20:18 发表 [回复]

回复 Jocodeoe:18 题的 A 不对,应该选最直接最暴力的 D (1 2 3) (2 3 1) (3 1 2) 每个数出现在不同位置上的概率相等,但这玩意明显不独立......(受到循环群启发了) Re: bulletnoid 2013-09-21 20:25 发表 [回复]

回复 bulletnoid:子曰:三短一长选其长。 16 楼 lumingming 2013-09-21 16:40 发表 [回复]

我怎么感觉错了好多啊。。。 15 楼 或许下一个路口 2013-09-21 11:40 发表 [回复]

(www.wenku1.com)12. A,怎么回事 n+边数了? Re: doc_sgl 2013-09-21 11:45 发表 [回复]

回复 f1520107395:我感觉应该是无向图为 N + 2*边数,但是答案没有,只好选这个最接近 的了。 Re: 或许下一个路口 2013-09-21 12:50 发表 [回复]

回复 doc_sgl:它题的意思是求表头的数组长度,你个节点,n 个表头。 另外,14 题答案应该是 2, 2 异或 31 相当于 00010 xor 11111 得到 11101 计算 31-2=29,然后就是求 29 异或-29,你 看看是不是? Re: hdupan 2013-09-21 18:54 发 表 [回复]

回复 f1520107395:这是幂吧 14 楼 zdw12242 2013-09-20 21:24 发表 [回复]

博主,求问 13 题如何计算啊?谢谢 Re: doc_sgl 2013-09-20 22:14 发表 [回复]

回复 zdw12242:已添加分析。 Re: 或许下一个路口 2013-09-21 12:08 发表 [回

复]

回复 doc_sgl:楼主,13 题回复的也太牵强了吧。 我的想法是: max=10,则出现的只能是 1,2,...10,由此求出出现的期望,大概是 2,字符串对应的 ASCII 有 256 个,所以,个人觉得 512 比 10 好多了 Re: bulletnoid 2013-09-21 20:19 发 表 [回复]

回复 f1520107395:13 题应该是 A 1024 出现 1 的概率是 1/(2^1)

(www.wenku1.com)出现 2 的概率是 1/(2^2) ... 出现 10 的概率是 1/(2^10) 若出现 1 个 10,则平均出现: (2^1) = 2 个 9 ... (2^8) = 256 个 2 (2^9) = 512 个 1 一共 1024 个 啊,不,是 1023......囧 Re: bulletnoid 2013-0921 20:31 发表 [回复]

回复 bulletnoid:注:^ 在这里表示幂; (差点被阿里搞死......) 13 楼 lilinfir 2013-09-20 20:52 发表 [回复]

各地方的题目一样么? Re: doc_sgl 2013-09-20 22:14 发表 [回复]

回复 lilinfir:布吉岛 12 楼 praylover 2013-09-20 20:47 发表 [回复]

4 场比赛怎么来的啊? 请楼主解释下哈…… Re: doc_sgl 2013-09-20 22:15 发表 [回复]

回复 praylover:见分析 11 楼 donshing 2013-09-18 22:50 发表 [回复]

各城市考的一样吗? Re: doc_sgl 2013-09-20 22:15 发表 [回复]

(www.wenku1.com)回复 donshing:自己都没考试,怎么知道一样不一样。。。 10 楼 有点发红 2013-09-16 12:08 发表 [回复]

卤煮能给个 29 题的方案吗?我觉得 4 不可能 Re: doc_sgl 2013-09-20 22:15 发表 [回复]

回复 sadfishsc:见分析 9 楼 或许下一个路口 2013-09-16 08:23 发表 [回复]

26 题应该是 4 吧。 Re: doc_sgl 2013-09-20 22:16 发表 [回复]

回复 f1520107395:啊,你再算算? Re: 或许下一个路口 2013-09-20 23:52 发表 [回复]

回复 doc_sgl:又算了一下应该是 6 1,51,351,531,2531,4253,1425,2145,其中 1,51,351,2531,4253,1425 缺页 8 楼 红白黑玫瑰 2013-09-16 08:06 发表 [回复]

我怎么算是 5 次呢红蓝 2/3 分只要满足红或蓝队的人是 12、23、34、45、51 就可以啊有兴趣 的加 2417972016 讨论一下啊 Re: weichaohnu 2013-09-16 14:56 发表 [回复]

回复 u012140713:12|345 1|2 3|45 4|5 Re: ROger__Wong 2013-09-16 16:18 发表 [回复]

(www.wenku1.com)回复 weichaohnu:举例来说,1 和 2 只在第二场比赛中有一次交手,所以不满足任意两人之 间有一场红对蓝和一场蓝队红(最少交手两次)这个条件吧 Re: weichaohnu 2013-09-16 16:54 发表 [回复]

回复 ROger__wonG:123|45 145|23 34|125 25|134 7 楼 低调小一 2013-09-16 01:00 发表 [回复]

27 题感觉出的很诡异,是公共节点是指一个,还是公共节点之后所有节点都满足该性质? 如果公共节点只有一个,可以采用 hash 的方法,时间复杂度 O(n),空间复杂度 O(n),节省空间 可以 O(n^2)的算法 如果是两个链表的公共节点可以直接参考《剑指 offer》了 Re: 土豪_Muscle 2013-09-18 02:35 发表 [回复]

回复 zinss26914:空间要求要小。。。还用 hash 啊? Re: doc_sgl 2013-09-16 09:17 发表 [回复]

复 zinss26914:题目没说公共节点只有一个,第一个公共节点之后所有节点都是满足 node in a 并且 node in b 的吧 6 楼 yangwenjun2017 2013-09-15 20:07 发表 [回复]

26 题即将被淘汰的是 3 Re: 低调小一 2013-09-16 01:21 发表 [回复]

回复 yangwenjun2017:确实是 5,可以参考我的博客 http://blog.csdn.net/wzy_1988/article/details/11714651 5 楼 转角天边 2013-09-15 16:01 发表 [回复]

(www.wenku1.com)最后一题应该是 6 吧 Re: doc_sgl 2013-09-20 22:17 发表 [回复]

回复 anhuizhuanjiao:见分析 4 楼 wanghb1989 2013-09-15 14:31 发表 [回复]

最后一题是 4 吗? Re: doc_sgl 2013-09-20 22:17 发表 [回复]

回复 wanghb1989:见分析 3 楼 wanghb1989 2013-09-15 14:30 发表 [回复]

27 题是找出公共节点,不是判断有没有公共节点 Re: fupacker 4 天前 19:38 发表 [回复]

回复 wanghb1989:真没懂他 27 题是怎么弄的 2 楼 闽悦蚊子 2013-09-15 11:33 发表 [回复]

28 题答案有错,因考虑整型溢出问题,可能为负数 Re: 代码与单车 2013-09-21 18:44 发表 [回复]

回复 laiwenyu913:(hash % 5 + 5) % 5 这样做应该可以了吧 Re: happyperson 2013-09-16 16:17 发表 [回复]

回复 laiwenyu913:与上最大整数就好了吧 Re: royripple 2013-09-15 13:43 发表 [回复]

回复 laiwenyu913:hash 只是个映射,溢不溢出不影响映射关系啊。 1 楼 rhr060252 2013-09-15 09:05 发表 [回复] [引用] [举报]

(www.wenku1.com)请问当时是不是把自带的简历交上去了?本人当时有事没去,据说这次没笔试成的人,直接进 入面试了 Re: Troy_ 2013-09-15 10:10 发表 [回复]

回复 rhr060252:得刷简历,刷上的人直接面试。刷不上的参加下次笔试

阅读详情:http://www.wenku1.com/news/EBBADCFE2B8B0BD5.html

范文七:阿里巴巴笔试记

阿里巴巴笔试记

2008-10-10 21:25

考点(不分先后次序):

C++:1.关于DOM的描述;2.网络蜘蛛系统;3.UTF-8;4.数据库检索:查准率和查全率;5.索引压缩;6.设计cralwer;7.Trie树查询;8.HTML&HTTP协议;9.信息检索模型;10.分布式通信协议;11.分布式搜索引擎;12.双向循环链表;13.快速排序;14.32位系统。

1. 关于DOM的描述:

javascrip里面的dom(文档对象模型)它是一种模型,将格式化文档对象化处理。在xml和html 的处理中广泛应用。 //dom是定义超文本结构的对象及方法,分层次的,有容器类的对象,也有基本元素对象,而这些对象,都包含有相应的属性和对应的操作方法(接口)。

//一般而言,DOM结构准确地反映了HTML文档所包含的内容,也就是说,每个HTML标记表现为一个标记节点(tag node),每个文本项内容表现为一个文本项节点(text node)。//是W3C组织推荐的处理可扩展置标语言的标准编程接口。

2. 网络蜘蛛系统

网络蜘蛛即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。

对于搜索引擎来说,要抓取互联网上所有的网页几乎是不可能的,从目前公布的数据来看,容量最大的搜索引擎也不过是抓取了整个网页数量的百分之四十左右。这其中的原因一方面是抓取技术的瓶颈,无法遍历所有的网页,有许多网页无法从其它网页的链接中找到;另一个原因是存储技术和处理技术的问题,

在抓取网页的时候,网络蜘蛛一般有两种策略:广度优先和深度优先(如下图所示)。广度优先是指网络蜘蛛会先抓取起始网页中链接的所有网页,然后再选择其中的一个链接网页,继续抓取在此网页中链接的所有网页。这是最常用的方式,因为这个方法可以让网络蜘蛛并行处理,提高其抓取速度。深度优先是指网络蜘蛛会从起始页开始,一个链接一个链接跟踪下去,处理完这条线路之后再转入下一个起始页,继续跟踪链接。这个方法有个优点是网络蜘蛛在设计的时候比较容易。两种策略的区别,下图的说明会更加明确。

在网络蜘蛛机器人系统里面,真正起指挥作用的是人工管理系统制定的规则和检索索引数据库。它可以决定什么样的网站抓的勤一点,或者干脆不抓.

3. UTF-8

使用UTF-8编码唯一的好处是,国外的用户如果使用Windows XP英文版,浏览UTF-8编码的任何网页,无论是中文、还是日文、韩文、阿拉伯文,都可以正常显示,UTF-8是世界通用的语言编码,UTF-8的推广要归功于Google的应用,以及Blog开发者。而如果用Windows XP英文版的IE6.0浏览gb2312语言编码的网页,则会提示是否安装语言包。因此,可能会失去很多的国外浏览者。 使用gb2312编码的好处是,因为程序产生的网页文本使用ANSI编码格式,会比UTF-8文本编码节省一些体积,访问速度会稍微快一点点,大约是30:38的比例,也就是30K的ANSI编码,转为UTF-8编码是38K,当然,这个比例并不准确,是会随Unicode字符集区域的不同而变化的。

UTF-8(8 位元 Universal Character Set/Unicode Transformation Format)是针对Unicode 的一种可变长度字符编码。它可以用来表示 Unicode 标准中的任何字符,而且其编码中的第一个字节仍与 ASCII 相容,使得原来处理 ASCII 字符的软件无需或只作少部份修改后,便可继续使用。因此,它逐渐成为电子邮件、网页及其他储存或传送文字的应用中,优先采用的编码。 UTF-8 编码提供了一种简便而向后兼容的方法, 使得那种完全围绕 ASCII 设计的操作系统, 比如 Unix, 也可以使用 Unicode. UTF-8. UTF_8字符集

UTF-8是UNICODE的一种变长字符编码,由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码UNICODE字符。如果UNICODE字符由2个字节表示,则编码成UTF-8很可能需要3个字节,而如果UNICODE字符由4个字节表示,则编码成UTF-8可能需要6个字节。用4个或6个字节去编码一个UNICODE字符可能太多了,但很少会遇到那样的UNICODE字符

4.数据库检索:查准率和查全率;

查全率与查准率是评价检索效果的两项重要指标。

查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。

查全率=[检出相关文献量/文献库内相关文献总量]×100%

查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。

查准率=[检出相关文献量/检出文献总量]×100%

通过对查准率和查全率的概念分析,得到了定性的结论:查全率依赖于查准率,查准率的提高有利于查全率的提高。通过对两者间关系的数学推导,得到了查准率和查全率之间一般性的定量关系。

5.索引压缩

建立索引是搜索引擎核心技术之一,建立索引的目的是能够快速的响应用户的查询。搜索引擎最常用的索引数据结构是倒排文档,倒排文档的原理其实相当简单。为什么要进行索引压缩?对索引进行压缩有很多好处:比如可以减少索引占用的磁盘空间和内存;比如可以减少I/O读写量; 比如可以查询响应速度加快;为了能够增加压缩效果,一般在进行压缩前先改写索引内容,首先把倒排索引的数值按照大小排序,然后用差值而非实际值表示(d-gap);这个是每个压缩算法开展前要做的工作;目前的压缩方法可以分为固定长度的和变长压缩。

具体说是将索引编码(落实到机器中应该是MD5哈希值)以一种压缩的方式来表示,既利于节省存储空间,又可以提高检索速度。其实,我觉得这个东西最大的好处还是节约“缓存空间”,提高访问速度。采用索引压缩能够带来很多好处,所以实用的搜索引擎都会采用索引压缩技术,但是对索引进行压缩也会带来问题,就是比不压缩需要更多的计算量.

6.设计cralwer

搜索引擎的工作整体上可分为三个部分,在第一阶段,Crawler开始“爬行”页面,获取最原始信息,Crawler是一段小程序,它通过初始地址,访问页面,分析出页面内部包括的链接,将链接传送给Crawler控制模块,Crawler控制模块判断哪些链接对应的页面是下一步需要访问的,哪一些是已经被访问过的,从而指示Crawler进行下一步“爬行”;另一方面,Crawler将获取到的Web页面传送到页面数据存储库(Page Repository)中,临时存储起来。第二阶段,索引器将库中存储的页面进行解析,根据索引构建原则创建索引,并将索引存储到索引库中,另外,在一些基于页面链接对页面进行排名的搜索引擎系统中,链接分析与页面排名的确定也在这个阶段完成。第三阶段,检索引擎处理用户的搜索请求,找

出相关页面文档,并根据页面排名高低,按顺序将结果返回给用户。三个阶段并行协同工作,维持搜索引擎的正常运转

爬行器技术 :爬行器(Crawler,Spider)又叫“爬虫”、“蜘蛛”,工作在搜索引擎的最前端,是搜索引擎中最关键的部分之一,它的性能好坏直接影响到搜索引擎对于页面信息的采集与更新。 Internet上的网页可以通过链接进行互访,这使得Crawler可以从初始URL出发,沿着链接导向,遍历Internet上整体网页构成的连通图。即使整体页面构成的图不是完全连通的,也可以将Internet上的页面集合看成是一个个连通的子图构成的,多个Crawler选择合理的起点,顺着页面链接进行爬行,也能遍历完整个图。考虑到网络上Web页面的数量非常庞大,设计一个性能良好的爬行器需要考虑以下4个问题[10]: 1.应下载哪些页面? 在多数情况下,Crawler并不下载Web上的所有页面,即使是最复杂的搜索引擎,其索引库中能检索到的页面也只占整个Web总页面的一小部分。所以,Crawler优先选择最“重要”的页面进行下载非常重要,以保证下载的部分更有价值。 2.如何更新页面?一旦Crawler下载了大量的页面,它会周期性的访问原始页面地址,看其是否是更新过的。Web上的页面内容可能变化非常快,Crawler必须决定以不同的频率访问不同的页面。

3.如何降低被爬行站点的负载?当Crawler获取页面时,需要消耗部分被访问服务器的资源,同时也占用网络带宽,增加了网络负担。Cralwer应使用相应的策略降低这些消耗,否则相应站点将禁止Cralwer去访问其页面。 4.如何并行化爬行过程? 由于要爬行的页面数量非常大,一个Crawler在一定时间内,通常不能胜任爬行所有页面的能力,必须使用多个Crawler来完成这一工作。因此,Crawler之间的并行协同工作显得非常重要。

针对Crawler工作任务的重要性及其工作量的巨大,许多搜索引擎采用了分布式Crawler技术,但是如何将巨大的爬行任务均衡地分配给各个Crawler是分布式WebCrawler的关键问题之一。目前许多Crawler系统都采用了集中式的任务分割策略

7.Trie树查询

基于三数组Trie索引树原理的汉语词典查询机制,并用递归算法实现构词状态表的自动构建. Trie树是搜索树的一种,来自英文单词

(1) 根节点不包含字符信息;

(3) 一棵m度的Trie或者为空,或者由m棵m度的Trie组成。

搜索字典项目的方法为:

(1) 从根结点开始一次搜索;(2) 取得要查找关键词的第一个字母,并根据该字母选择对应的子树,转到该子树继续进行检索;

(3) 在相应的子树上,取得要查找关键词的第二个字母,并进一步选择对应的子树进行检索。

4) 迭代过程„„

(5) 在某个结点处,关键词的所有字母已被取出,则读取附在该结点上的信息,即完成查找。 双数组Trie(Double-Array Trie)是trie树的一个简单而有效的实现,由两个整数数组构成,一个是base[],另一个是check[]。设数组下标为i ,如果base[i],check[i]均为0,表示该位置为空。如果base[i]为负值,表示该状态为词语。Check[i]表示该状态的前一状态,t=base[i]+a, check[t]=i 。

8.HTML&HTTP协议

HTML(Hyper Text Mark-up Language )即超文本标记语言,是 WWW 的描述语言,由 Tim Berners-lee提出。设计 HTML 语言的目的是为了能把存放在一台电脑中的文本或图形与另

一台电脑中的文本或图形方便地联系在一起,形成有机的整体,人们不用考虑具体信息是在当前电脑上还是在网络的其它电脑上。这样,你只要使用鼠标在某一文档中点取一个图标,Internet就会马上转到与此图标相关的内容上去,而这些信息可能存放在网络的另一台电脑中。HTML文本是由 HTML命令组成的描述性文本,HTML 命令可以说明文字、 图形、动画、声音、表格、链接等。 HTML的结构包括头部 (Head)、主体 (Body) 两大部分。头部描述浏览器所需的信息,主体包含所要说明的具体内容。

HTTP协议(Hypertext Transfer Protocol,超文本传输协议)是用于从WWW服务器传输超文本到本地浏览器的传送协议。它可以使浏览器更加高效,使网络传输减少。它不仅保证计算机正确快速地传输超文本文档,还确定传输文档中的哪一部分,以及哪部分内容首先显示(如文本先于图形)等。超文本传输协议(HTTP)是一种为分布式,合作式,多媒体信息系统服务,面向应用层的协议。它是一种通用的,不分状态(stateless)的协议,除了诸如名称服务和分布对象管理系统之类的超文本用途外,还可以通过扩展它的请求方式,错误代码和报头[47]来完成许多任务。HTTP的一个特点是数据表示方式的典型性和可协商性允许独立于传输数据而建立系统。

9.信息检索模型;

信息检索的数学模型 2.1 信息检索系统的形式化表示 2.2 集合论检索模型 2.2.1 布尔检索模型 2.2.2 模糊集合模型 2.2.3 扩展布尔模型2.3 代数论检索模型 2.3.1 向量空间模型 2.3.2 潜在语义索引模型 2.3.3 神经网络模型 2.4 概率论检索模型 2.4.1 经典概率模型 2.4.2 基于Bayesian网络的检索模型 2.5 其他信息检索模型与数学理论 2.5.1 结构化检索模型 2.5.2 浏览模型 2.5.3 其他新型数学理论提出了一种基于本体语义模型的信息检索方法。该方法充分利用领域本体提供的概念之间的语义相关性,从语义模型扩展、概念相似度、相关度计算,并以用户反馈等角度探讨了基于语义模型的自动推理方法在信息检索中的应用,文章介绍了系统实现框架. 包括布尔检索模型、向量空间模型和概率检索模型在内的信息检索数学模型.

10.分布式通信协议;

分布式虚拟环境(DVE)中高速运动实体的状态更新数据量很大,对实时性要求高,现有的通讯协议不支持消息废除,因而不能很好地支持新的状态更新消息覆盖过时消息。文章提出了一种可更新队列的概念模型,在此基础上提出了一种新的协议方案,它支持过时消息的丢弃,更好地满足了实时交互的需要。分布式实时数据库系统必须能够处理具有时间限制的应用,而这些应用所涉及的某些数据又不在应用本地,所以不可避免地要与网络上的其它结点进行通讯,传送数据或消息.在分布式实时数据库系统中,不仅要求数据值正确,而且具有时间限制,即在规定的时间内,值正确的数据才是有效的.所以,实时通讯中,不仅要求数据或消息传送正确,而且要尽可能保证或必须保证数据或消息在应用可允许的时间范围内完成传送.

11.分布式搜索引擎

分布式搜索引擎是根据地域、主题、IP地址及其它的划分标准将全网分成若干个自治区域,在每个自治区域内设立一个检索服务器,而每个检索服务器由信息搜索机器人、索引搜索软件数据库和代理三部分组成。信息搜索机器人负责本自治区域内的信息搜索,并建立索引信息存入索引数据库。代理负责向用户提供查询接口,并与其它代理进行互换,实现检索服务器之间的信息交换,且查询可以重定向,即如果一个索引数据库没有满足查询要求,它可以将查询请求发送到其它检索服务器上。 它与集中式搜索引擎相比有以下优点:各检索服务器之间相互共享资源,站点只向本自治区域内的信息搜索机器人提供信息,减轻了网络及各站点的负载。各代理之间的相互协作

及查询重定向使得提供的服务更完善。 与Web本身的分布式特性相适应,具有良好的可扩充性,便于维护。索引信息划分到各自的索引数据库中,使得各索引数据库相对较小,查询的响应时间相对较短。部分检索服务器发生故障时,其它部分能正常工作。Web服务器集群是一种典型的分布式处理系统。所谓Web集群就是采用高速网络,将原来独立的若干个服务器联结起来,作为一个整体提供服务,把到达的请求分配到集群中的各个后台服务器上,让它们分摊负载及I/O,通过并行处理提高性能。此时涉及到请求分配器及负载平衡的技术问题。开发垂直门户的分布式搜索引擎系统时,发现有四种不同应用的分布式搜索引擎: 1. 分布式元搜索: 2. 散列分布搜索引擎 3. Peer 2 peer 搜索引擎 4. 局部遍历型搜索引擎.分布式元搜索:

14.32位系统

32位系统指机内 数据长度,指令长度,地址长度是二进制32位。 64位系统指机内 数据长度,指令长度,地址长度是二进制64位。 64位系统速度快。32位系统系统要寻高于32位的地址就要用到复杂一点的运算,用两个32位单元组合成(好几步才能到位)。64位系统直接寻址(一步到位)。

JAVA:1.Servlet中怎样控制页面在客户端的缓存策略;2.执行存储过程;3.JSP;

4.Thread.wait()可否设置超时;5.注释XML内容:CDATA;6.IOC;7.Open-Closed原则含义;8.JUnit TestCase基类中的代码;9.javax.servle.http.HttpServlet;10.JDBC连接池&功能;11.XML Schema:&;12.领域模型;13.Servlet生命周期。

还有综合类的,就有点类似公务员考试的题目,还有一些关于计算机的题目,例如考点:

1. 软件测试的对象;2.用户进程的跟踪信息存在于什么目录;3.how使普通用户可执行超

级用户文件;4.向有限空间输入超长字符串是什么攻击,等等。大题就两道:1.隐马尔科夫模型(HMM)的3个基本问题;2.(写函数的)。其实看到这些题目,我就蒙了,有些根本就没见过。但是别怕,是否做出这些题目,并不是他们是否选择你的标准(我觉得),都是摸一下底而已。我相信,大部分的人都是做不出来的,里面涉及的知识点,也不是全能从课本学来,靠的是积累。当然,这些也只是我个人的看法,因为我也没过这个笔试,不过我觉得我还是有收获的。这是我第一个参加的笔试,重在过程,所以我列下了这两个方向的考点,可能还是有点参考价值吧!

2. 隐马尔科夫模型(hidden Markov model,缩写为HMM)的提出最初是在语音处

理领域。HMM是在Markov链的基础上发展起来的一种统计模型。由于实际问题比Markov链模型所描述的更为复杂,因此在HMM中观察到的事件与状态并不是一一对应,而是与每个状态的一组概率分布相联系。它是一个双重随机过程,其中之一是Markov链,描述状态的转移;另一个描述每个状态和观察值之间的统计对应关系。这样,HMM以概率模型描述观察值序列,具有很好的数学结构,能够比较完整地表达观察值序列的特征。

阅读详情:http://www.wenku1.com/news/1CAD657A55248232.html

范文八:阿里巴巴笔试

2014阿里巴巴9月15

2013年9月15日

14:39

1.假设把整数关键码K散列到N个槽的散列表,以下哪些散列函数是好的散列函数__.

A、h(k) = k / N;

B、h(k) = 1;

C、h(k) = k mod N;

D、h(k) = (k + Random(N))mod N, Random(N)返回一个0到N-1的整数

2.下面的排序算法中,初始数据集的排列顺序对算法的性能无影响的是__.

A.堆排序 B、插入排序

C、冒泡排序 D、快速排序

3.下面说法错误的是__.

A、CISC计算机比RISC计算机指令多。

B、在指令格式中,采用扩展操作码设计方案的目的是为了保持指令长度而增加寻址空间

C、增加流水线段数理论上可以提高CPU频率

D、冯.诺依曼机体系结构的主要特征是存储程序的工作方式

4.不属于冯.诺依曼机体系结构必要组成部分的是__.

A、CPU B、Cache C、RAM D、ROM

5.一个栈的入栈序列为A B C D E 则不可能的输出序列为__.

A、DECBA B、DCEBA C、ECDBA D、ABCDE

6.你认为可以完成编写一个C语言编译器的程序设计语言是__.

A、汇编语言 B、C语言 C、VB语言 D、以上皆可

7.关于C++/JAVA类中的static成员和对象成员的说法正确的是__.

A、static成员变量在对象构造时生成

B、static成员函数在对象成员函数中无法调用

C、虚成员函数不可能是static成员函数

D、static成员函数不能访问static成员变量

8.假设下图中每个正方形的边长为1,则从A到Z的最短路径条数为_____

A 、11 B、12 C、

13 D、14

9、某进程在运行过程中需要等待从磁盘读入数据,此时该进程的状态将:______

A、从运行变为阻塞 B、从运行变为就绪

C、从就绪变为运行 D、从阻塞变为就绪

10、下面算法的时间复杂度为:______

int f ( unsigned int n )

{

if( n == 0 || n == 1 )

return 1;

else return n*f(n-1);

}

A、O(1) B、O(n) C、O(n^2) D、O(n!)

11、n从1开始,每个操作可以选择对n加1,或者对n加倍。如果想获得整数2013,最少需要____个操作

A、18 B、24 C、21 D、不可能

12、对于一个具有n个顶点的无向图,若采用邻接表表示,则存放表头结点的数组的大小为______

A、n B、n+1 C、n-1 D、n+边数

13、考虑一个特殊的hash函数h,能将任一字符串hash马一个整数k,其概率P(k)=2^(-k),k=1,2,..., ∞。对一个未知大小的字符串集合S中的每一个元素取hash值所组成的集合为h(S)。若h(S)中最大的元素max h(S)=10,那么S的大小的期望是_______

A、1024 B、512 C、

5 D、10

14、如下函数,在32位bits系统foo(2^31-3)的值是___

int foo(int x) {

return x&-x;

}

A、0 B、1 C、2 D、4

15、对于顺序存储的线性数组,访问结点和增加,删除结点时间复杂度

为:______

A、O(n),O(n) B、A、O(n),O(1) C、A、O(1),O(n) D、A、O(1),O(1)

16.在32位操作系统环境,编译选项为4字节对齐,那么sizeof(A)和sizeof(B)是__.

struct A{

int a;

short b;

int c;

char d;

};

struct B{

int a;

short b;

char d;

int c

};

A、 16,16 B、 13,12 C、 16,12 D、 11,16

17.袋中有红球、黄球、白球各1个,每次任取一个又放回,如此连续抽取3次,则下列事件中概率是8/9的是___.

A、颜色全相同 B颜色不全相同 C、颜色全不同 D、颜色无红色

18.一个洗牌程序的功能是将n张牌的顺序打乱。以下关于洗牌程序的功能定义说法最恰当的是__.

A、每张牌出现在n个位置上的概率相等

B、每张牌出现在n个位置上的概率独立

C、任何连续位置上的两张牌的内容独立

D、n张牌的任何两个不同的排列出现的概率相等

19.用两种颜色去染色排成一个圈的6个棋子,如果通过旋转得到则只算一种,问一共有多少__种染色模式

A、 10 B、14 C、15 D、16

20.递归式的先序遍历一个n节点,深度为d的二叉树,需要栈空间的大小为___.

A、O(n)

B、O(d)

C、O(logn)

D、O(nlogn)

第二部分 不定向选择

21.两个线程运行在双核机器上,每个线程主进程如下,线程主程序如下,线程1:x = 1; r1 = y; 线程2:y = 1; r2 = x; x和y是两个全局变量,初始为0.以下哪一个是r1和r2的可能值__.

A、r1 = 1, r2 = 1;

B、r1 = 1,r2 = 0;

C、r1=0,r2=0

D、r1=0,r2=1

22.关于Linux系统的负载(Load),以下表述正确的是___.

A、通过就绪和运行的进程数来反映

B、可以通过TOP命令查看

C、可以通过uptime查看

D、Load:2.5,1.3,1.1表示系统的负载压力在逐渐减小

23、关于排序算法的以下说法,错误的是_____

A、快速排序的平均时间复杂度为O(nlogn),最坏时间复杂度为O(n^2)

B、堆排序的平均时间复杂度为O(nlogn),最坏时间复杂度为O(nlogn)

C、冒泡排序的平均时间复杂度为O(n^2),最坏时间复杂度为O(n^2)

D、归并排序的平均时间复杂度为O(nlogn),最坏时间复杂度为O(n^2)

24、假定函数rand_k会随机返回一个[1,k]之间的整数(k>=2),并且每个整数值出现的几率相等。已知目前有rand_7和四则运算函数,并适当增加逻辑判断和循环等控制逻辑,下列函数可以实现的有______

A、rand_3 B、rand_21 C、rand_23 D、rand_47

第三部分 填空与问答( 5题,共30分)

25、(4分)某二叉树的前序遍历序列为-+a*b-cd/ef,后序遍历的序列为abcd-*+ef/-,问其中中序遍历序列是______

26、(6分)某缓存系统采用LRU淘汰算法,假定缓存容量为4,并且初始为空,那么在顺序访问以下数据项的时候

1,5,1,3,5,2,4,1,2

出现缓存直接命中的次数是_____,最后缓存中即将准备淘汰的数据项是_____。

27、(6分)有两个比较长的单向链表a 和b 为了找出节点node满足

node in a 并且node in b。请设计师空间使用尽量小的算法(用C/C++/java或伪代码表示都可以)。

28、(6分)当存储数据量超出单节点数据管理能力的时候,可以采取的方法有数据库sharding的解决方案,也就是按照一定的规律把数据分散存储在多个数据管理节点N中(节点编号为0,1,2,....,N-1)。假设存储的数据是a,请完成以数据a计算存储节点的程序。(没学过C语言的同学也可以用伪代码完成)

#define N 5

int hash(int element ) {

return element * 2654435761;

}

int shardingIndex(int a) {

int p = hash(a);

______________________________________

return p;

}

29、(8分)宿舍内5个同学一起玩对战游戏。每场比赛有一些人作为红方,另一些人作为蓝方,请问至少需要多少场比赛才能使任意两个人之间有一场红方对蓝方和一场蓝方对红方的比赛?

1.注明: D

Hash函数是指把一个大范围映射到一个小范围。把大范围映射到一个小范围的目的往往是为了节省空间。在考虑使用Hash函数之前,需要明白它的几个限制:

(1). Hash的主要原理就是把大范围映射到小范围;所以,你输入的实际值的个数必须和小范围相当或者比它更小。不然冲突就会很多。

(2). 由于Hash逼近单向函数;所以,你可以用它来对数据进行加密。

(3). 不同的应用对Hash函数有着不同的要求;比如,用于加密的Hash函数主要考虑它和单项函数的差距,而用于查找的Hash函数主要考虑它映射到小范围的冲突率。

Hash函数好坏非评判标准:简单和均匀。

简单指散列函数的计算简单快速;

均匀指对于关键字集合中的任一关键字,散列函数能以等概率将其映射到表空间的任何一个位置上。也就是说,散列函数能将子集K随机均匀地分布在表的地址集{0,1,„,m-1}上,以使冲突最小化。

2.A

3.B

注意:

增加流水线级数有利于提高CPU主频,我们先对流水线的级数与其周期的关系给出一个公式,一个k级流水线,处理n个任务总共需要花费“k+(n-1)”个周期,这是因为先是处理第一个任务就需要k个时钟周期,k个周期后流水线被装满,剩余n-1个任务只需n-1个周期就能完成。如果同样数量的n个任务不采用流水线处理,那么就需要n*k个周期,我们把两者做比,得到另一个概念,叫做流水线加速比C,所以C=n*k / [k+(n-1)],当n远远大于k时,C的值趋进于k,也就是说,理论上k级流水线几乎可以提高k倍速度,但这仅限于理论

B: 在指令格式中,采用扩展操作码设计方案的目的是为了保持指令字长度不变而增加指令操作的数量.

7.c

16.c

阅读详情:http://www.wenku1.com/news/E0D463C145874EE7.html

范文九:阿里巴巴(笔试3)

客第四期移动开发最佳博主评选

2013阿里巴巴校园招聘笔试题

2013-05-05 16:43 1032人阅读 评论(4) 收藏 举报

阿里巴巴校园招聘算法

今天刚参加完阿里巴巴的笔试,单选,多选,综合题。

单选考的比较杂,每门课考一两道题甚至一两个选项,Linux啊,网络啊,操作系统啊,,,

多选5道题,也差不多是比较杂的,这些都没什么难度,如果基础还好的话。。。

大题目前两题很简单的送分题,一个是数组的逆置,一个是操作系统里面作业调度算法先进先出和最短作业优先。

后面四道题如下(希望我的回忆没有太大出入,表述没有歧义):

1.有个苦逼的上班族,他每天忘记定闹钟的概率为0.2,上班堵车的概率为0.5,如果他既没定闹钟上班又堵车那他迟到的概率为1.0,如果他定了闹钟但是上班堵车那他迟到的概率为0.9,如果他没定闹钟但是上班不堵车他迟到的概率为0.8,如果他既定了闹钟上班又不堵车那他迟到的概率为0.0,那么求出他在60天里上班迟到的期望。

【这是一道概率题】

2.有n(n>4)个士兵,他们每个人都掌握属于自己的情报,如果两个

士兵之间交换一次情报,就能拥有对方的情报,现在设计一种交换次数最少的算法,使得所有士兵都能拥有全部情报,并给出最少的交换次数。

3.舞会上有n-1个群众和1个明星,所有的群众都认识明星,群众之间相互是否认识并不确定,明星不认识任何一个群众,现在如果你是机器人R2T2,你每次问一个人是否认识另外一个人的代价为O(1),试设计一种算法找出明星,并给出时间复杂度(没有复杂度不得分)。

【这题我是这样想的:将n个人分成相等的两组,如果是奇数个,多余的那个暂时不管,然后这两组一对一的互相问是否认识对方,总的开销是O(n),然后把其中互相都认识和都不认识的去掉(因为明星肯定不在),将剩下来的组中被认识的那些人提取出来(如果前面分组有个多余的也加进来)继续分成两组做上面的工作,此时最多有n//2人参加分组,这样递归到最后两个人的时候,被认识的那个就是明星,时间复杂度为O(n),注:这里之前写错了,T(n)=O(n)+T(n/2)=>T(n)=O(n)】

4.有一个淘宝卖家,他在全国有n个仓库,这n个仓库真好构成一个环形,即1->2->3->4......->n-1->n->1的环,开始他所有仓库的货物数是不定的,现在他想让所有仓库的货物数都相等,如何运输这些货物使得运输次数最少,运输只能在两个相邻的仓库之间发生。试设计算法。 我是属于打酱油的,最后一题根本没有时间做,前面的估计也做的不好。 大家一起加油!!!

阅读详情:http://www.wenku1.com/news/DE8A7D0D9B3810A9.html

范文十:阿里巴巴笔试题

1、 给定一个 query 和一个 text,均由小写字母组成。要求在 text 中找出以同样的顺序连续 出现在 query 中的最长连续字母序列的长度。 例如,query 为“acbac”, text 为“acaccbabb”, 那么 text 中的“cba”为最长的连续出现在 query 中的字母序列,因此,返回结果 应该为 其长度 3。请注意程序效率。

2、 写一个函数,输入一个二叉树,树中每个节点存放了一个整数值,函数返回这棵二叉树 中相差最大的两个节点间的差值绝对值。请注意程序效率。

3、写一个函数,输入一个二叉树,树中每个节点存放了一个整数值,函数返回这棵二叉树 中相差最大的两个节点间的差值绝对值。请注意程序效率。

阅读详情:http://www.wenku1.com/news/194E88961A11BC76.html