开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> C++知识库 -> Modern C++ 学习笔记——C++函数式编程 -> 正文阅读

[C++知识库]Modern C++ 学习笔记——C++函数式编程

往期精彩：

Modern C++ 学习笔记——C++函数式编程

关键字：lambda表达式、函数式编程

文章目录

Modern C++ 学习笔记——C++函数式编程

函数式编程

在之前的系列文章中介绍过函数对象和lambda表达式，本篇文章就来讲讲它们的主要用途——函数式编程。

什么是函数式编程？

那什么是函数编程呢？它其实来自于数学中的理念.

f(x) = 2x^2 +x+3
g(x) = 3f(x) + 5 = 6x^2 + 3x + 14
h(x) = f(x) + g(x) = 8x^2 + 4x + 17

正如上面的数学函数一样，对于函数式编程，它只关心于定义输入数据和输出数据的关系，在数学表达式中我们称其为输入与输出的一种映射（map），即用函数定义输入数据和输出数据的关系是什么样的。
这样就可以得到关于函数式编程一下特点：

无状态：函数不维护任何状态。函数式编程的核心精神是stateless。
不可变数据：输入数据不可变，动了输入数据就有危险，所以要返回新的数据集。
或许这么说有点干燥，为了更好的帮助理解，再举一个最简单的例子：

int copy_add(int x, int y)
{
	return x + y;
}
int nocopy_add(int& x, int& y)
{
	x += y;
	return x;
}

以上两个函数都实现了对输入的两个int类型值进行相加并且返回的功能，第一个函数式比较纯粹的函数，符合我们上面所说的函数式编程的特点。再看第二个函数，它将入参设为引用（在项目中，为了减少值对象拷贝的性能消耗，常把入参设为引用），这就带来了问题——入参很容易在函数内部被改变。
在著作《Functional Programming in C++》（非常推荐此书）中给出了关于函数式编程的定义：

Functional programming is a style of programming that emphasizes the evaluation of expressions, rather than execution of commands. The expressions in these languages are formed by using functions to combine basic values. A functional language is a language that supports and encourages programming in a functional style.

简单来说：在OOP（面向对象编程）中，正如大多数人做的那样，更多的考虑是算法的步骤，即对对象的处理。而在函数式编程里你需要学会如下的思考方式：什么是输入，什么是输出，还有需要执行哪些转换将两者映射起来。

函数式编程

在介绍了函数编程之后，我们尝试使用其思想来解决实际的问题：假如有个vector保存着文件中的所有单词，需要统计其所有单词出现的频率，并且按照评率高低输出对应单词。最传统的命令式编程大概会这么写：

void print_word(vector<string>& words) {
    unordered_map<string, int> wordCount;
    for (auto&& s : words) {
        unordered_map<string, int>::iterator iter = wordCount.find(s);
        if (iter == wordCount.end()) {
            wordCount.insert({s, 1});
        } else {
            wordCount[s]++;
        }
    }
    vector<pair<int, string>> reverseword;
    for (auto it = wordCount.begin(); it != wordCount.end(); ++it) {
        reverseword.emplace_back(make_pair(it->second, it->first));
    }
    sort(reverseword.begin(), reverseword.end(), [](const pair<int, string>& lhs, const pair<int, string>& rhs) {
        return lhs.first > rhs.first;
    }); // 高阶函数
    for (auto& p : reverseword) {
        cout << "word is " << p.second << ", count is " << p.first << endl; 
    }
}

为完成所需要的功能，主要由以下过程组成：

将所有的单词插入unordered_map<string, int>中，并统计出现的次数（unordered_map要比map更快些）
vector< string> -> unordered_map<string, int>
将unordered_map<string, int>中的键值对转换为pair<int, string>并存入vector
unordered_map<string, int> ->vector<pair<int, string>>
对所有pair<int, string>排序
vector<pair<int, string>> -> vector<pair<int, string>>
遍历vector，输出单词和统计次数
vector<pair<int, string>> -> void

在这里插入图片描述

可以看出我们可以拆为更小的函数（做更简单的事），然后将他们组合起来：

unordered_map<string, int> count_occurrencese(vector<string> items);
vector<pair<int, string>> reverse_pairs(unordered_map<string, int> pairs);
vector<pair<int, string>> sort_by_frequency(vector<pair<int, string>>);
void print_pairs(vector<pair<int, string>> pairs);

是不是发现了什么端倪？是的，我们可以通过组合的方式完成上面命令式代码同样的功能。

void print_words(vector<string>& words)
{
    return print_pairs(
        sort_by_frequency(
            reverse_pairs(
                count_occurrencese(words)
            )
        );
}

或许你会觉得这也没啥嘛，之前的代码不也是按照如此的算法过程实现的。那么我们考虑如下场景：当我的输入不在是vector，而是一个文件，统计其中单词频率并输出，我们只需要在声明一个函数words: file -> vector<string>完成文件到单词的映射，之后与上面类似进行组合即可，而不用再对print_words进行修改。当输入变成已统计好的unordered_map时候，也同理。
我们把之前过程是编程范式叫做——指令式编程，而把函数式编程范式叫做——声明式编程。可不要小瞧这一个思维的转变，它带来的变化可谓是相当大的。还是上面的例子，假如我们对其使用一些C++中的语法糖，你会发现是如此甜蜜：

template <typename C, typename T = typename C::value_type>
std::unordered_map<T, unsigned int> count_occurrences(const C& collection)
template <typename C, typename P1, typename P2>
std::vector<std::pair<P2, P1>> reverse_pairs(const C& collection);

在上面的声明中，函数count_occurrences变得将能够接受任何集合，只要其能够推断其包含项的类型（C::value_type）。从此它不再局限于我们上面需求中，你可以用来来统计字符串中字符、整数列表中的整数值、字符串集合中的字符串等等。其他声明的函数也可以做类似的扩展。

函数式编程的特点

函数式编程期望函数的行为项数学上的函数，而非一个计算机上的“子程序”。这样的函数一般被称为纯函数（pure function），主要体现在确定性。所谓确定性，就是像数学中那样，f(x) = y 这个函数无论什么场景都会得到同样的结果。而不是像程序中的很多函数那样。同一个参数，在不同的场景下会计算出相同的结果，这个我们称之为函数的确定性。所谓不同的场景，就是我们的函数会根据运行中的状态信息的不同而发生变化。

我们的代码也体现了函数式编程的一些特点：

会影响函数结果的只是函数的参数，没有对环境的依赖。
返回的结果就是函数执行的唯一结果，不产生对环境的其他影响。
函数的执行没有顺序上的问题
函数可以像普通的对象一样被传递、使用或返回。
代码更像是说明式而非命令式。熟悉函数式编程后，你会发现说明式代码的可读性比命令式更高，代码更短，可复用性更高。
无状态，没有状态就没有伤害，就像没有依赖就没有伤害一样。

函数式编程用到的技术

first class function（头等函数）

正如前文所述，在函数式编程中函数就如同对象一样，可以被传递、使用、或返回。而这些函数被称为头等函数，也有人将函数式编程中的函数称为一等公民。
在C++中可以做到这一点的有函数对象，lambda表达式（推荐阅读[lambda表达式篇](https://blog.csdn.net/weixin_43077022/article/details/117926275?spm=1001.2014.3001.5501），此外还有std::function，std::bind等。

class filter{ // 函数对象
public:
    students() 
    {
        names.insert("abc");
        names.insert("John");
    }    
    bool operator()(std::string name) {
        return names.find(name) == names.end();
    }
private:
    set<std::string> names;
};
// lambda 表达式，用auto捕获匿名函数对象
auto add2 = [](int x) {	return x + 2; }

map & reduce & filter

在函数式编程很多函数已称为了基本的惯用法（在不同语言有不同名字），而**map（映射）、reduce（归并）和filter（过滤）**为其中最为常见也是最为基础的三个。

map

Map在C++中的直接映射是transform（头文件< algorithm>）。他所做的事情也是数学上的映射，把一个范围里的对象转换为相同数量的另外一些对象。假如有类person，我需要获得人到姓名的映射，即vector<person> -> vector<string>

struct person;
vector<string> GetNames(vector<person> people)
{
	vector<string> names;
    transform(people.begin(), people.end(), back_inserter(names), [](const person& tmp) {
        return tmp.name;
    });
    return names;
}

std::back_inserter是定义在头文件 <iterator>中，用于构造 std::back_insert_iterator 的便利函数模板[3].

reduce

Reduce在C++中的直接映射是accumulate（头文件< numeric>）。它的功能是在指定的范围内，使用给定的出事和函数对象，从左到右对数值进行归并[4]。看两个计算平均值的写法：

double average_score_1(const vector<int>& scores)
{
	int sum = 0;
	for (int socre : scores) {
		sum += socre;
	}
	return sum / (double)scores.size();
}

double average_score_2(const vector<int>& scores)
{
	return accumulate(scores.begin(), scores.end(), 0) / (double)scores.size();
}

此外，还可以提供第四个参数用于其他计算，例如如下代码实现累乘：

	int product = std::accumulate(v.begin(), v.end(), 1, std::multiplies<int>());

上述的代码可以显而易见的得出，比起过程式的语言来说，函数式编程在代码上要更容易阅读。（传统过程式的语言需要使用for/while循环，然后在各种变量中把数据倒过来倒过去的）。此外，再考虑我们之前说到的函数是无状态的，这意味着并行无问题，尤其在本例中明显。在面临大量的数据时，函数式编程能够提供并行性。而在C++17引入了std::reduce[5]，以及执行策略[6]让其并行计算成为可能。

int main()
{
    std::vector<double> v(10'000'007, 0.5);
    {
        auto t1 = std::chrono::high_resolution_clock::now();
        double result = std::accumulate(v.begin(), v.end(), 0.0);
        auto t2 = std::chrono::high_resolution_clock::now();
        std::chrono::duration<double, std::milli> ms = t2 - t1;
        std::cout << std::fixed << "std::accumulate result " << result
                  << " took " << ms.count() << " ms\n";
    }
    {
        auto t1 = std::chrono::high_resolution_clock::now();
        double result = std::reduce(std::execution::par, v.begin(), v.end());
        auto t2 = std::chrono::high_resolution_clock::now();
        std::chrono::duration<double, std::milli> ms = t2 - t1;
        std::cout << "std::reduce result "
                  << result << " took " << ms.count() << " ms\n";
    }
}

可能的输出：

std::accumulate result 5000003.50000 took 12.7365 ms
std::reduce result 5000003.50000 took 5.06423 ms

filter

Filter的功能是进行过滤，筛选出符合条件的成员。在C++中的映射有copy_if和partition。

auto is_female = [](const person& tmp) { return tmp.female; };
auto iter = std::partition(people.begin(), people.end(), is_female);

vector<person> females;
std::copy_if(people.cbegin(), people.cend(), std::back_inserter(females), is_female);

pipeline（管道）

该技术的意思是，将函数实例成一个一个的action，然后将一组 action 放到一个数组或是列表中，再把数据传给这个 action list，数据就像一个 pipeline 一样顺序地被各个函数所操作，最终得到我们想要的结果。正如在前文组装函数那样。

void print_words(vector<string>& words)
{
    return print_pairs(
        sort_by_frequency(
            reverse_pairs(
                count_occurrencese(words)
            )
        );
}

pipeline 管道借鉴于Unix Shell的管道操作——把若干个命令串起来，前面命令的输出成为后面命令的输入，如此完成一个流式计算。（注：管道绝对是一个伟大的发明，他的设哲学就是KISS – 让每个功能就做一件事，并把这件事做到极致，软件或程序的拼装会变得更为简单和直观。）
比如shell命令：

ps auwwx | awk '{print $2}' | sort -n | xargs echo

查看一个用户执行的进程列表，列出来以后，然后取第二列，第二列是它的进程 ID，排个序，再把它显示出来。

在C++20引入范围库（ranges）之后，可以使用operator |链接两个范围适配器闭包对象的结果。而在此之前我们可以尝试重载管道符，达到类似的效果。以下例子仅为了说明该项技术。

template<typename T, typename F>
auto operator | (T t, F f) -> T
{
    return f(t);
}
auto f = [](const int& a) {return a + 1;};
auto g = [](const int& a) {return a * 2;};
auto h = [](const int& a) {return a - 1;};
auto y = 3 | h | g | f;

currying (柯里化)

将一个函数的多个参数分解成多个函数，然后将函数多层封装起来，每层函数都返回一个函数去接收下一个参数，这可以简化函数的多个参数。简单点说就是函数到函数。

auto addThree = [](int x, int y, int z){
  return x + y + z; };
auto addTwoToOne = [addThree](int x, int y) {
  return [=](int z) {
    return addThree(x, y, z);
  };
};
auto addOneToTwo = [addThree](int x) {
  return [=](int y, int z) {
    return addThree(x, y, z);
  };
};
auto addOneByOne = [addTwoToOne](int x) {
  return [=](int y) {
    return addTwoToOne(x, y);
  };
};

cout << "addThree = " << addThree(1, 2, 3) <<endl;
cout << "addTwoToone = " << addTwoToOne(1, 2)(3) <<endl;
cout << "addOneToTwo = " << addOneByOne(1)(2)(4) <<endl;

在上面的代码中addThree函数实现了对三个int值进行相加的操作。然后对该函数进行了拆分，将其拆为addTwoToOne，进而拆为addOneToOne，在调用的时候就变成了
addOneByOne(1)(2)(4)，而这个过程就被称作currying（柯里化）。
我们上面做的那个函数拆解也正是此意。
在这里插入图片描述

recursing & tail recursion optimization (递归&尾递归优化)

递归最大的好处就是简化代码，可以把一个复杂问题用很简单的代码描述出来。（注意：递归的精髓是描述问题，这也是函数是编程的精髓）。
我们也知道递归的危害，那就是如果递归很深的话，stack受不了，并会导致性能大幅度下降。因此，我们使用尾递归优化技术——每次递归时都会重用stack，这样能够提升性能。或许Stack Overflow上的这篇问答能够帮你解释What is tail call optimization?
C++ 标准库并不保证尾递归优化能够执行，但是主流的C++编译器（如GCC\Clang\MVSC）都是支持尾递归优化的。

[1]《Functional Programming in C++》
https://www.manning.com/books/functional-programming-in-c-plus-plus

[2]https://zh.cppreference.com/w/cpp/algorithm/transform

[3]https://zh.cppreference.com/w/cpp/iterator/back_inserter

[4]https://zh.cppreference.com/w/cpp/algorithm/accumulate

[5]https://zh.cppreference.com/w/cpp/algorithm/reduce

[6]https://zh.cppreference.com/w/cpp/algorithm/execution_policy_tag_t

[7]https://zh.cppreference.com/w/cpp/algorithm/partition

[8]https://zh.cppreference.com/w/cpp/ranges

[9]How can currying be done in C++?
https://stackoverflow.com/questions/152005/how-can-currying-be-done-in-c

[10]https://coolshell.cn/articles/10822.html

C++知识库最新文章

【C++】友元、嵌套类、异常、RTTI、类型转换