v8实现sort的原理
问题1:
sort 方法到底是用了哪种排序思路?问题2:
sort 方法里面的参数对比函数是什么意思?sort 方法的基本使用
sort 方法是对数组元素进行排序,默认排序顺序是先将元素转换为字符串,然后再进行排序
arr.sort([compareFunction])
const months = ['March', 'Jan', 'Feb', 'Dec'];
months.sort();
console.log(months);
// ['Dec', 'Feb', 'Jan', 'March']
const array1 = [1, 30, 4, 21, 100000];
array1.sort();
console.log(array1);
// [1, 100000, 21, 30, 4]
const array1 = [1, 30, 4, 21, 100000];
array1.sort((a,b) => b - a);
console.log(array1); // [100000, 30, 21, 4, 1]
const array1 = [1, 30, 4, 21, 100000];
array1.sort((a, b) => a - b);
console.log(array1); // [1, 4, 21, 30, 100000]
- 如果compareFunction(a, b)小于0,那么a会被排列到b之前
- 如果compareFunction(a, b)等于0,a和b的相对位置不变
- 如果compareFunction(a, b)大于0,b会被排列到a之前
sort 方法的底层实现
sort 方法的内部是如何实现的呢?
sort 方法在V8内部相较于其他方法而言是一个比较难得方法,对于很多边界情况结合排序算法做了反复的优化
底层 sort 源码分析
- 当 n <= 10 时,采用插入排序
- 当 n > 10 时,采用三路快速排序
- 10 < n <= 1000,采用中位数作为哨兵元素
- n > 1000,每隔 200~215 个元素挑出一个元素放到一个新数组中,然后对它排序,找到中间位置的数以此作为中位数
插入排序理论上是平均时间复杂度为o(n^2)的算法
快速排序是一个平均o(nlogn)级别的算法
这只是理论上平均的时间复杂度估算
实际情况中两者的算法复杂度前面都会有一个系数,当n足够小的时候,快速排序nlogn 的优势会越来越小
为什么要花这么大的力气选择哨兵元素?插入排序经过优化后,对于小数据集的排序会有非常优越的性能
快速排序的性能瓶颈在于递归的深度,最坏的情况是每次的哨兵都是最小元素或者最大元素,那么进行partition(一边是小于哨兵的元素,另一边是大于哨兵的元素)时,就会有一边是空的
如果这样排下去递归的层数就达到了n,而每一层的时间复杂度就是o(n),所以快排会退化成o(n^2)的级别,如何避免?让哨兵元素尽可能地处于数组的中间位置,让最大或最小的情况尽可能少
官方sort的基本结构:
function ArraySort(comparefn) {
CHECK_OBJECT_COERCIBLE(this, 'Array.prototype.sort');
var array = TO_OBJECT(this);
var length = TO_LENGTH(array.length);
return InnerArraySort(array, length, comparefn);
}
function InnerArraySort(array, length, comparefn) {
// 比较函数未传入
if (!IS_CALLABLE(comparefn)) {
comparefn = function (x, y) {
if (x === y) return 0;
if (%_IsSmi(x) && %_IsSmi(y)) {
return %SmiLexicographicCompare(x, y);
}
x = TO_STRING(x);
y = TO_STRING(y);
if (x==y) return 0;
else return x < y ? -1 : 1;
};
}
function InsertionSort(a, from, to) {
// 插入排序
for (var i = from + 1; i < to; i++) {
var element = a[i];
for (var j = i - 1; j >= from; j--) {
var tmp = a[j];
var order = comparefn(tmp, element);
if (order > 0) {
a[j + 1] = tmp;
} else {
break;
}
}
a[j + 1] = element;
}
}
function GetThirdIndex(a, from, to) { // 元素个数大于1000时寻找哨兵元素
var t_array = new InternalArray();
var increment = 200 + ((to - from) & 15);
var j = 0;
from += 1;
to -= 1;
for (var i = from; i < to; i += increment) {
t_array[j] = [i, a[i]];
j++;
}
t_array.sort(function(a, b)) {
return comparefn(a[1], b[1]);
};
var third_index = t_array[t_array.length >> 1][0];
return third_index;
}
function QuickSort(a, from, to) { // 快速排序实现
// 哨兵位置
var third_index = 0;
while (true) {
if (to - from <= 10) {
InsertionSort(a, from, to); // 数据量小,使用插入排序,速度较快
return
}
if (to - from > 1000) {
third_index = GetThirdIndex(a, from, to);
} else {
// 小于1000直接取中点
third_index = from + ((to - from) >> 1);
}
// 下面开始快排
var v0 = a[from];
var v1 = a[to - 1];
var v2 = a[third_index];
var c01 = comparefn(v0, v1);
if (c01 > 0) {
var tmp = v0;
v0 = v1;
v1 = tmp;
}
var c02 = comparefn(v0, v2);
if (c02 > 0) {
var tmp = v0;
v0 = v2;
v2 = v1;
v1 = tmp;
} else {
var c12 = comparefn(v1, v2);
if (c12 > 0) {
var tmp = v1;
v1 = v2;
v2 = tmp;
}
}
a[from] = v0;
a[to - 1] = v2;
var pivot = v1;
var low_end = from + 1;
var high_start = to - 1;
a[third_index] = a[low_end];
a[low_end] = pivot;
partition: for(var i = low_end + 1; i < high_start; i++) {
var element = a[i];
var order = comparefn(element, pivot);
if (order < 0) {
a[i] = a[low_end];
a[low_end] = element;
low_end++;
} else if (order > 0) {
do {
high_start--;
if (high_start == i) break partition;
var top_elem = a[high_start];
order = comparefn(top_elem, pivot);
} while (order > 0);
a[i] = a[high_start];
a[high_start] = element;
if (order < 0) {
element = a[i];
a[i] = a[low_end];
a[low_end] = element;
low_end++;
}
}
}
// 快排的核心思路,递归调用快速排序方法
if (to - high_start < low_end - from) {
QuickSort(a, high_start, to);
} else {
QuickSort(a, from, low_end);
from = high_start;
}
}
}
}
总结
排序算法 | 时间复杂度(最好) | 时间复杂度(平均) | 时间复杂度(最差) | 空间复杂度 | 稳定性 |
---|---|---|---|---|---|
快速排序 | o(nlogn) | o(nlogn) | o(n^2) | o(nlogn) | 不稳定 |
插入排序 | o(n) | o(n^2) | o(n^2) | o(1) | 稳定 |